Файл:Автоматический независимый от языка анализ авторства патристических текстов на основании статистики частот переходов (2017).pdf

Материал из patristics
Перейти к навигации Перейти к поиску

Краткое описание[править]

Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности алгоритма от величины анализируемого текста и эталонных текстов каждого из предполагаемых авторов. Тестирование проводится методом повторяющегося скользящего контроля по k-блокам и отдельно на 35 выбранных текстах 3-х авторов. Предлагается модификация алгоритма в некоторых случаях дающая лучший результат на тестовых данных. Делается вывод о достаточно высокой точности описанного алгоритма и о возможности его применения для решения реальных задач. В качестве примера использования описывается определение авторства текстов De creatione hominis sermo 1, 2 (CPG 3215, 3216) между свт. Василием Великим и свт. Григорием Нисским.

История файла

Нажмите на дату/время, чтобы увидеть версию файла от того времени.

Дата/времяРазмерыУчастникПримечание
текущий10:56, 13 февраля 20240 × 0 (287 Кб)Vyacheslav-fv (обсуждение | вклад)
14:46, 15 сентября 20230 × 0 (188 Кб)Vyacheslav-fv (обсуждение | вклад)Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности...

Нет страниц, использующих этот файл.