Файл:Автоматический независимый от языка анализ авторства патристических текстов на основании статистики частот переходов (2017).pdf: различия между версиями
(Vyacheslav-fv загрузил новую версию Файл:Автоматический независимый от языка анализ авторства патристических текстов на основании статистики частот переходов (2017).pdf) |
|
(нет различий)
|
Текущая версия от 10:56, 13 февраля 2024
Краткое описание[править]
Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности алгоритма от величины анализируемого текста и эталонных текстов каждого из предполагаемых авторов. Тестирование проводится методом повторяющегося скользящего контроля по k-блокам и отдельно на 35 выбранных текстах 3-х авторов. Предлагается модификация алгоритма в некоторых случаях дающая лучший результат на тестовых данных. Делается вывод о достаточно высокой точности описанного алгоритма и о возможности его применения для решения реальных задач. В качестве примера использования описывается определение авторства текстов De creatione hominis sermo 1, 2 (CPG 3215, 3216) между свт. Василием Великим и свт. Григорием Нисским.
История файла
Нажмите на дату/время, чтобы увидеть версию файла от того времени.
Дата/время | Размеры | Участник | Примечание | |
---|---|---|---|---|
текущий | 10:56, 13 февраля 2024 | 0 × 0 (287 Кб) | Vyacheslav-fv (обсуждение | вклад) | |
14:46, 15 сентября 2023 | 0 × 0 (188 Кб) | Vyacheslav-fv (обсуждение | вклад) | Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности... |
Вы не можете перезаписать этот файл.
Использование файла
Нет страниц, использующих этот файл.