Софт по распознанию стиля текста

Discussion in 'С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby' started by OMERTA, 23 Jul 2011.

  1. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    Опять о софте:

    есть ли такой софт, который мог бы проанализировать 2 разных текста и сказать на сколько %, он мог быть написан одним и тем же человеком? по словам, использованию пунктуации, оборотов, возможно ошибок и вообще - стилю письма \ текста?

    думаю что такого нет, тогда вопрос - возможно ли написать такой софт???
     
  2. xophet

    xophet Member

    Joined:
    16 Apr 2011
    Messages:
    617
    Likes Received:
    49
    Reputations:
    5
    Жесть у тебя запросы!!!
    Это как бы отдельная профессия, ей учатся годами.
    Я очень сомневаюсь, что при текущем развитии компьютеров ее можно написать.

    ________________________________________
    НЕ в качестве оффтопа
    До сих пор нету нормального переводчика, который бы переводил текст с учетом стиля повествования и хотя бы приблизительно верно выбирал падежи и времена.
     
    #2 xophet, 23 Jul 2011
    Last edited: 23 Jul 2011
  3. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    причем здесь запросы? есть такая необходимость - вот и вопросы появляются.
    10 лет назад никто и не думал, что будут такие возможности как сейчас, возможно такого рода сервисы существуют, возможно нет - вот и интересует возможность либо найти такого рода софт или создать... понятно, что это что - то типа универсальной почерковедческой экспертизы - только по стилю а не по почерку, но все же - мало чего знаю не возможного...
     
  4. makag

    makag Staatsanwalt

    Joined:
    27 Sep 2009
    Messages:
    480
    Likes Received:
    564
    Reputations:
    98
    Такого софта нет и в обозримом будущем не будет.
    На вопрос о принадлежности текста тому либо иному лицу может достоверно ответить только почерковедческая экспертиза
     
  5. ЕгоАкк

    ЕгоАкк Banned

    Joined:
    21 Sep 2009
    Messages:
    84
    Likes Received:
    18
    Reputations:
    0
    Видел такой, на php.
     
  6. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    если видел - дай ссыль
     
  7. Lee_fx

    Lee_fx Elder - Старейшина

    Joined:
    27 Sep 2008
    Messages:
    90
    Likes Received:
    14
    Reputations:
    0
    Можно попробывать реализовать подобное, опираясь на статистику. Подсчитывать какие-либо детали, начиная с предлогов и кончая анализом текста. Потом придумать как все это скоррелировать друг с другом и в итоге писать софт)

    Сделать так чтобы это все работало довольно сложно, тут больше нужно думать на бумажке, нежели в редакторе кода) Хотя если получится - оторвут с руками и ногами, востребованная штука, например для определения плагиата. С таким делом не долго и какого-нить PhD получить)
     
  8. tim-oleksii

    tim-oleksii Member

    Joined:
    14 Mar 2011
    Messages:
    199
    Likes Received:
    10
    Reputations:
    0
    Это ж гугл. ТС хочет запилить свой гугл.
     
  9. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    ни хрена... все на много серьезней)
    такая штука была бы весьма востребована не только в озвученных ресурсах.
    есть примерное мнение о стоимости создания?
     
  10. xophet

    xophet Member

    Joined:
    16 Apr 2011
    Messages:
    617
    Likes Received:
    49
    Reputations:
    5
    Нет-нет, есть ребята (не помню как профессия называется) так вот они именно по стилю написания определяют копирайт.
    Действие происходит так: ты им пишешь отрывочек текста на заданную тематику, а они читают этот отрывочек и сравнивают с повестью.
     
  11. tim-oleksii

    tim-oleksii Member

    Joined:
    14 Mar 2011
    Messages:
    199
    Likes Received:
    10
    Reputations:
    0
    Нету мнения, так как я даже не представляю матмодель.
     
  12. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    ясно) спс...
     
  13. Osstudio

    Osstudio Banned

    Joined:
    17 Apr 2011
    Messages:
    638
    Likes Received:
    160
    Reputations:
    81
    Думаю, написать всё-таки можно. Но довольно большой код получается...я бы взял примерно 80 000 (Но почти не представляю, сколько в реальности, так как подобного рода софта не делал :) ).
    А сделать это можно методом "почерк-код", там что-то типа диаграммы делается, затем эти две диаграммы совмещаются и проверяются на "похожость"
     
  14. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    80 000 чего?
     
  15. Osstudio

    Osstudio Banned

    Joined:
    17 Apr 2011
    Messages:
    638
    Likes Received:
    160
    Reputations:
    81
    Рублей, а в реальности возможно и $$$ ;)
     
  16. xophet

    xophet Member

    Joined:
    16 Apr 2011
    Messages:
    617
    Likes Received:
    49
    Reputations:
    5
    Да вы не понимаете чего хочет автор:
    не по почерку сравнивать, а ПО СТИЛЮ ПОВЕСТВОВАНИЯ
     
    1 person likes this.
  17. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    верно.

    не загружать скан письма, а сравнивать к примеру мой пост здесь с моим постом на другом форуме под другим ником, и сказать на сколько 2 данных - разных текста - могут принадлежать одному и тому же автору, в процентном, к примеру, соотношению. т.е. по стилю написания, возможно ошибкам, окончаниям, пунктуации и др возможным критериям.
     
    1 person likes this.
  18. Osstudio

    Osstudio Banned

    Joined:
    17 Apr 2011
    Messages:
    638
    Likes Received:
    160
    Reputations:
    81
    Ах раз об этом... то тут можно сказать только с "малопроцентной" вероятностью (10-15%)...
    Ну в принципе, если пообщаться с психологами (и другими врачами/спецами), я думаю, можно вывести определённые критерии, и затем, опираясь на них, сравнивать, но опять же, 100% вероятности не будет. :)
     
  19. Osstudio

    Osstudio Banned

    Joined:
    17 Apr 2011
    Messages:
    638
    Likes Received:
    160
    Reputations:
    81
    И тем более, человек не всегда пишет одинаково.
     
  20. OMERTA

    OMERTA Banned

    Joined:
    8 Jun 2010
    Messages:
    255
    Likes Received:
    95
    Reputations:
    -2
    да все это понятно. если привлекать специалистов, то в принципе - основная работа лежит на них - экспертах по почерковедческой и психологами, лингвистами, филологами - имея эти определения - будет не сложно написать софт?