Опять о софте: есть ли такой софт, который мог бы проанализировать 2 разных текста и сказать на сколько %, он мог быть написан одним и тем же человеком? по словам, использованию пунктуации, оборотов, возможно ошибок и вообще - стилю письма \ текста? думаю что такого нет, тогда вопрос - возможно ли написать такой софт???
Жесть у тебя запросы!!! Это как бы отдельная профессия, ей учатся годами. Я очень сомневаюсь, что при текущем развитии компьютеров ее можно написать. ________________________________________ НЕ в качестве оффтопа До сих пор нету нормального переводчика, который бы переводил текст с учетом стиля повествования и хотя бы приблизительно верно выбирал падежи и времена.
причем здесь запросы? есть такая необходимость - вот и вопросы появляются. 10 лет назад никто и не думал, что будут такие возможности как сейчас, возможно такого рода сервисы существуют, возможно нет - вот и интересует возможность либо найти такого рода софт или создать... понятно, что это что - то типа универсальной почерковедческой экспертизы - только по стилю а не по почерку, но все же - мало чего знаю не возможного...
Такого софта нет и в обозримом будущем не будет. На вопрос о принадлежности текста тому либо иному лицу может достоверно ответить только почерковедческая экспертиза
Можно попробывать реализовать подобное, опираясь на статистику. Подсчитывать какие-либо детали, начиная с предлогов и кончая анализом текста. Потом придумать как все это скоррелировать друг с другом и в итоге писать софт) Сделать так чтобы это все работало довольно сложно, тут больше нужно думать на бумажке, нежели в редакторе кода) Хотя если получится - оторвут с руками и ногами, востребованная штука, например для определения плагиата. С таким делом не долго и какого-нить PhD получить)
ни хрена... все на много серьезней) такая штука была бы весьма востребована не только в озвученных ресурсах. есть примерное мнение о стоимости создания?
Нет-нет, есть ребята (не помню как профессия называется) так вот они именно по стилю написания определяют копирайт. Действие происходит так: ты им пишешь отрывочек текста на заданную тематику, а они читают этот отрывочек и сравнивают с повестью.
Думаю, написать всё-таки можно. Но довольно большой код получается...я бы взял примерно 80 000 (Но почти не представляю, сколько в реальности, так как подобного рода софта не делал ). А сделать это можно методом "почерк-код", там что-то типа диаграммы делается, затем эти две диаграммы совмещаются и проверяются на "похожость"
верно. не загружать скан письма, а сравнивать к примеру мой пост здесь с моим постом на другом форуме под другим ником, и сказать на сколько 2 данных - разных текста - могут принадлежать одному и тому же автору, в процентном, к примеру, соотношению. т.е. по стилю написания, возможно ошибкам, окончаниям, пунктуации и др возможным критериям.
Ах раз об этом... то тут можно сказать только с "малопроцентной" вероятностью (10-15%)... Ну в принципе, если пообщаться с психологами (и другими врачами/спецами), я думаю, можно вывести определённые критерии, и затем, опираясь на них, сравнивать, но опять же, 100% вероятности не будет.
да все это понятно. если привлекать специалистов, то в принципе - основная работа лежит на них - экспертах по почерковедческой и психологами, лингвистами, филологами - имея эти определения - будет не сложно написать софт?