Замечания и комментарии
1.Мнение о работе:="Молодец."
2.Мнение о работе:="ХА, ДА ЭТО работает!!! Класс!"
3.Мнение о работе:="Хорошая штука для писателей..."
4.Мнение о работе:="ой, пойду-ка я Некрасова перечитаю...:) Это Виктор Суворов, "Аквариум". "
5.Мнение о работе:="Путная штукенция!"
6.Мнение о работе:="Забавно, да."
7.Мнение о работе:="Понравилось. А автора зовут Вадим Храппа (Калининград)"
8.Мнение о работе:="Забавно .... Карлос Кастанеда получается похож на Льва Толтого, Чернышевского и Пелевина (в порядке убывания вероятности)."
9.Мнение о работе:="Интересно! Мы ввели собственный роман "Искушение фотографа". Влинятие Стругацких, безусловно, мого присутствовать. А вот первого и третьего авторов мы не читали"
10.(Пользователь НЕ согласен с ответом) Мнение о работе:="Это Шумилов"
11. Мнение о работе:="ой. это вообще-то Достоевский, а пишет "Этот текст, по-видимому, не содержит индивидуальных стилистических черт. Список наиболее близких авторов (в порядке убывания вероятности): М.Зощенко, М.Е.Салтыков-Щедрин, Э.Тайрд-Боффин." Честно говоря, параметр "распределение триад" вызывает большое сомнение"
12.Мнение о работе:="Однако! Блин, определил.... Значит, научно-техническим статьям стилистика по рангу не положена? "
13.Мнение о работе:="Здорово, только это был не Булычёв, а Лукьянов. Кое-что о нём говорит, конечно ;)"
14.Мнение о работе:="Попал ;)"
15.Мнение о работе:="ваш анализ временами очень очень точен. но временами его результаты просто странные. мне показалось, что он в первую очередь руководствуется лексикой произведений."
16. Мнение о работе:="А вот если в романе зафиксировать множество имен собственных, то идентифицировать текст -- сами понимаете.
Не уверен, что понимаю: если в качестве "элементной базы" для характеристики текстов фиксировать набор имен собственных вместе с их частотами, то Фрэнка Герберта от Андрэ Нортона отличить будет легко, а Тургенева от Аксакова - вряд ли. Если же имеется в виду, что полный набор собственных имен есть уникальная характеристика романа, то может быть это и так, но основной-то вопрос к Атрибутору - на что похож (из имеющейся базы данных) вновь введенный текст? Если это новый текст (пусть даже того же имеющегося в базе условного "Нортона") - набор имен будет скорее всего уникальным (тут у нонешних авторов фантазия буйная) и ни с каким текстом из базы не будет совпадать. Вопрос же о близости текстов все равно потребует введения метрики для сравнения частотных кривых и пр., т.е. той же техники, которая сейчас и используется в Атрибуторе. Единственое отличие, возникающее в этом случае - смена элементной базы (сейчас используются трехбуквенные сочетания). Пробовать можно и должно все разумное, что приходит в голову, но пока у нашего коллектива не хватает ресурсов.
Надеюсь, что это -- не такой дешевый фокус... (Есть еще и иные особые приметы -- у Пелевина, скажем, есть экзотическое слово "копирайтер" -- в такой убогой транскрипции. И если первое -- Вы не совершали, то второе -- сделали скорее всего, это, должно быть, часть алгоритма. Не правда ли?)
Увы - не правда. В "Описании" Атрибутора вполне честно изложен базовый принцип его действия - сравнение частот трехбуквенных сочетаний (это не шутка). Принцип очень простой, но, тем самым, довольно устойчиво работающий. Что касается использования "экзотики" в качестве характеристики текста, то мне кажется, что не всегда она поможет, т.к. не всегда имеет место, либо, наоборот, слишком разнообразна. Например, в позапрошлом, "серебряном" веке русской литературы ею пользовался, мягко скажем, не каждый автор. А если Вам пришел новый текст того же Пелевина, то в нем "копирайтер" может исчезнуть, а появится, например, "трейдмаркер" (тоже в убогой транскрипции), и что прикажете с этим делать? В такой ситуации угадать, что автор тот же Пелевин, Атрибутору будет непросто.
С уважением - Тимашев.
17. Мнение о работе:="Это был текст Марка Твена. Рассказ "Жив он или умер?" "Атрибутор" правильно опознал наличие иронии, но относительно правильности тезиса "Этот текст, по-видимому, не содержит индивидуальных стилистических черт. Список наиболее близких авторов (в порядке убывания вероятности): М.Е.Салтыков-Щедрин, Н.В.Гоголь, Н.С.Лесков" сомневаюсь... Чт подразумевается под "индивидуальными стилистическими чертами"? И как понимать отсутствие таковых у трех названных русских писателей? "
Фактически автором данного текста является не единолично "законный" автор, а пара - автор-переводчик. Имеются многочисленные примеры экспертных оценок таких текстов, которые показывают, что разные переводы одного и того же текста могут сильно различаться по стилю. В дальнейшем предполагается провести работу по получению формальных оценок таких расхождений с помощью Атрибутора;
По этой причине пока в базе Атрибутора переводов текстов иностранных авторов нет и получаемая вами оценка близости к имеющимся в базе отечественным авторам носит весьма условный характер.
А.Н. Тимашев
18. "Веселый Ответ, Такой же как и сам рассказ... Это рассказы с сайта www.rastaman.tales.ru Автор Дм. Гайдук".
19. Текст принадлежит Карлосу Кастанеде, а не Л.Н.Толстому - это начало 5 книги ВТОРОЕ КОЛЬЦО СИЛЫ.
20. Классная программа! Вот как оценены рассказы Зощенко: "Этот текст, по-видимому, не содержит индивидуальных стилистических черт. Список наиболее близких авторов (в порядке убывания вероятности): В.Кунин, А. и Б.Стругацкие. Отстой!"
[В НАЧАЛО СТРАНИЦЫ] [АТРИБУТОР]
|