Файл:Автоматический независимый от языка анализ авторства патристических текстов на основании статистики частот переходов (2017).pdf: различия между версиями
(Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности...) |
|||
Строка 1: | Строка 1: | ||
== Краткое описание == | == Краткое описание == | ||
Описывается применение алгоритма независимого от языка автоматического | |||
анализа авторства на основании подсчета статистики частот переходов двухбуквенных | Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности алгоритма от величины анализируемого текста и эталонных текстов каждого из предполагаемых авторов. Тестирование проводится методом повторяющегося скользящего контроля по k-блокам и отдельно на 35 выбранных текстах 3-х авторов. Предлагается модификация алгоритма в некоторых случаях дающая лучший результат на тестовых данных. Делается вывод о достаточно высокой точности описанного алгоритма и о возможности его применения для решения реальных задач. В качестве примера использования описывается определение авторства текстов De creatione hominis sermo 1, 2 (CPG 3215, 3216) между свт. Василием Великим и свт. Григорием Нисским. | ||
сочетаний для патристических авторов со II по XII век писавших на древнегреческом | |||
языке. Авторство анализируемого текста определяется на основании близости по | |||
заданному расстоянию к эталонным текстам различных авторов. Расстояние | |||
подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. | |||
Обсуждается зависимость точности алгоритма от величины анализируемого текста и | |||
эталонных текстов каждого из предполагаемых авторов. Тестирование проводится | |||
методом повторяющегося скользящего контроля по k-блокам и отдельно на 35 | |||
выбранных текстах 3-х авторов. Предлагается модификация алгоритма в некоторых | |||
случаях дающая лучший результат на тестовых данных. Делается вывод о достаточно | |||
высокой точности описанного алгоритма и о возможности его применения для решения | |||
реальных задач. В качестве примера использования описывается определение авторства | |||
текстов De creatione hominis sermo 1, 2 (CPG 3215, 3216) между свт. Василием Великим | |||
и свт. Григорием Нисским. |
Версия от 14:47, 15 сентября 2023
Краткое описание
Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности алгоритма от величины анализируемого текста и эталонных текстов каждого из предполагаемых авторов. Тестирование проводится методом повторяющегося скользящего контроля по k-блокам и отдельно на 35 выбранных текстах 3-х авторов. Предлагается модификация алгоритма в некоторых случаях дающая лучший результат на тестовых данных. Делается вывод о достаточно высокой точности описанного алгоритма и о возможности его применения для решения реальных задач. В качестве примера использования описывается определение авторства текстов De creatione hominis sermo 1, 2 (CPG 3215, 3216) между свт. Василием Великим и свт. Григорием Нисским.
История файла
Нажмите на дату/время, чтобы увидеть версию файла от того времени.
Дата/время | Размеры | Участник | Примечание | |
---|---|---|---|---|
текущий | 10:56, 13 февраля 2024 | 0 × 0 (287 Кб) | Vyacheslav-fv (обсуждение | вклад) | |
14:46, 15 сентября 2023 | 0 × 0 (188 Кб) | Vyacheslav-fv (обсуждение | вклад) | Описывается применение алгоритма независимого от языка автоматического анализа авторства на основании подсчета статистики частот переходов двухбуквенных сочетаний для патристических авторов со II по XII век писавших на древнегреческом языке. Авторство анализируемого текста определяется на основании близости по заданному расстоянию к эталонным текстам различных авторов. Расстояние подсчитывается на основе частот переходов одних двухбуквенных сочетаний в другие. Обсуждается зависимость точности... |
Вы не можете перезаписать этот файл.
Использование файла
Нет страниц, использующих этот файл.