В данной работе рассматривается применение алгоритмов нечеткого сравнения строк для задачи распознавания команд. Описываются три алгоритма: Левенштейна, Дамерау-Левенштейна и Джаро-Винклера. Приводится их математическое описание и особенности применения. Проводится оценка точности работы алгоритмов на наборе тестовых данных.
Идентификаторы и классификаторы
- УДК
- 004.85. Обучение
Распознавание команд является важной задачей во многих интерактивных системах, таких как голосовые помощники, интерфейсы командной строки и т. д. Зачастую пользовательский ввод может содержать ошибки или отклонения от ожидаемой формы команды, затрудняющие ее распознавание. Одним из подходов к решению этой проблемы является применение алгоритмов нечеткого сравнения строк, которые позволяют гибко сопоставлять команды с учетом возможных ошибок и вариаций ввода.
Список литературы
1. Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Докл.АН_СССР. 1965. 163 (4). C. 845-848.
Levenshtein V.I. Binary codes with correction of dropouts, inserts and substitutions of characters // Dokl.USSR Academy of Sciences. 1965. 163 (4). C. 845-848.
2. Лещенко А.В. Практическое применение алгоритмов нечеткого поиска // Сборник научных трудов_НГТУ. 2018. №3-4(93). С. 59-69.
Leshchenko A.V. Practical application of fuzzy search algorithms // Collection of scientific papers of_NSTU. 2018. No.3-4(93). pp. 59-69.
3. Поиск нечетких соответствий: сравнение записей по расстоянию между строками [Электронный ресурс].URL: https://www.megaputer.com/ru/fuzzy_matching_comparing_records_with_tringdistance_measures/(дата_обращения:30.04.2024).
Search for fuzzy matches: comparison of records by line spacing [Electronic resource].URL: https://www.megaputer.com/ru/fuzzy_matching_comparing_records_with_stringdis_tance_measures/(date_of_access:30.04.2024).
4. Wagner R. A., Fischer M. J. The string to string correction problem. J.ACM, v. 21(1), 1974. P. 168.
Wagner R. A., Fischer M. J. The string tostring correction problem. J.ACM, v. 21(1), 1974. P. 168.
5. Damerau-Levenshtein Edit Distance Explained [Электронный ресурс].URL:https://www.lemoda.net/tex_tfuzzy/damerau_levenshtein/(дата_обращения:30.04.2024).
Damerau-Levenshtein Edit Distance Explained [Electronic resource].URL: https://www.lemoda.net/text_fuzzy/damerau_levenshtein/(date_of_reference:30.04.2024).
6. Jaro distance [Электронный ресурс].URL: https://rosettacode.org/wiki/Jaro_distance(дата_обращения:30.04.2024).
Jaro distance [Электронный ресурс].URL:https://rosettacode.org/wiki/Jaro_distance(дата_обращения:30.04.2024).
7. Winkler W. E. String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage, Proceedings of the Section on Survey Research Methods, American Statistical Association, 1990, P. 354-359.
Winkler W. E. String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage, Proceedings of the Section on Survey Research Methods, American Statistical Association, 1990, P. 354-359.
8. Сходство Джаро - Винклера. Нечеткое сравнение строк [Электронный ресурс].URL: http://xn-1-6kca8bgsjrjhe.xnp1ai/public/1172479/(дата_обращения:30.04.2024).
Jaro-Winkler Similarity. Fuzzy string comparison [Electronic resource].URL: http://xn-1-6kca8bgsjrjhe.xn-p1ai/public/1172479/(accessed:30.04.2024).
9. Code Spelunking: Jaro-Winkler String Comparison [Электронный ресурс].URL: https://lingpipe_blog.com/2006/12/13/code_spelunking_jarowinkler_string_comparison/(дата_обращения:30.04.2024).
Code Spelunking: Jaro-Winkler String Comparison [Электронный ресурс].URL: https://lingpipe_blog.com/2006/12/13/code_spelunking_jarowinkler_string_comparison/дата_обращения:30.04.2024).
10. Navarro G. A guided tour to approximate string matching,ACM Computing Surveys, 2001, v.33 (1), P. 31-88. EDN: FMOPSD
Navarro G. A guided tour to approximate string matching,ACM Computing Surveys, 2001, v.33 (1), P. 31-88. EDN: FMOPSD
11. Winkler W. E. String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage, Proceedings of the Section on Survey Research Methods, American Statistical Association, 1990, P. 354-359.
Winkler W. E. String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage, Proceedings of the Section on Survey Research Methods, American Statistical Association, 1990, P. 354-359.
12. Brinardi L., Seng H. Text Documents Plagiarism Detection using Rabin Karpand Jaro-Winkler Distance Algorithms, Indonesian J. of Electrical Engineering and Computer Science, 2017, v.5(2), P. 462-471.
Brinardi L., Seng H. Text Documents Plagiarism Detection using Rabin Karpand Jaro-Winkler Distance Algorithms, Indonesian J. of Electrical Engineering and Computer Science, 2017, v.5(2), P. 462-471.
13. Златопольский Д.М. Основы программирования на языке Python. - М.:ДМК Пресс, 2017. - 284 с.
Zlatopolsky D.M. Fundamentals of programming in Python. - M.:DMK Press, 2017. - 284 p.
14. Федоров, Д. Ю. Программирование на языке высокого уровня Python: учебное пособие для прикладного бакалавриата / Д. Ю. Федоров. - 2-е изд., перераб. и доп. - Москва: Издательство Юрайт, 2019. - 161 с. - (Бакалавр. Прикладной курс). - - Текст: электронный //ЭБС Юрайт [сайт]. -URL: https://urait.ru/bcode/437489(дата_обращения:30.04.2024). ISBN: 978-5-534-10971-9
Fedorov, D. Y. Programming in a highlevel Python language: a textbook for applied bachelor’s degree / D. Y. Fedorov. - 2nd ed., reprint. and additional - Moscow: Yurait Publishing House, 2019. - 161 p. - (Bachelor’s degree. Applied course). - 978-5-534- 10971-9. - Text: electronic //EBS Yurayt [website]. -URL: https://urait.ru/bcode/437489(date_of_access:30.04.2024). ISBN: 978-5-534-10971-9
15. Шелудько, В. М. Язык программирования высокого уровня Python. Функции, структуры данных, дополнительные модули: учебное пособие / В. М. Шелудько. - Ростов на Дону, Таганрог: Издательство Южного федерального университета, 2017. - 107 c. - - Текст: электронный // Электронно библиотечная система_IPR_BOOKS: [сайт]. -URL: http://www.iprbookshop.ru/87530.html(дата_обращения:30.04.2024).-Режим_доступа:для_авторизир.пользователей. ISBN: 978-5-9275-2648-2 EDN: XMFETR
Sheludko, V. M. Python high level programming language. Functions, data structures, additional modules: a textbook / V. M. Sheludko.- Rostov on Don, Taganrog: Southern Federal University Press, 2017. - 107 p. - - Text: electronic // Electronic Library system_IPR_BOOKS: [website]. -URL: http://www.iprbookshop.ru/87530.html(date_of_access:30.04.2024).-Access_mode:for_authorization_users. ISBN: 978-5-9275-2648-2
Выпуск
Другие статьи выпуска
Глобальная характеристика структуры предпочтения лица, принимающего решение (ЛПР), играет важную роль при решении практических задач выбора. На ее основе исследователь может объективно сократить число альтернатив, в дальнейшем предъявляемых ЛПР, и тем самым повысить эффективность процедур выбора.
В настоящее время в исследованиях, относящихся к указанной области, имеется единственный пример информации, которую можно отнести к глобальной характеристике структуры предпочтения: упорядочение критериев по важности. Однако отсутствуют процедуры получения от ЛПР такой информации и сами понятия “критерий а важнее критерия b” и “критерий а равноценен критерию b” имеют в разных ситуациях разную трактовку.
В настоящей работе предлагается глобальная характеристика структуры предпочтения для задач выбора с одним ЛПР в предположении, что структура предпочтения ЛПР может быть описана некоторой функцией, удовлетворяющей аксиомам рационального выбора.
Рассматривается подход к разработке критериев и модели описания и оценки эффективности принятия решения по определению конструкционных параметров навесов от атмосферных осадков для пассажиров во время ожидания транспорта для обеспечения уровня комфортности на основе обработки информации.
Проведен анализ статистики распределения влаги от осадков на существующих железнодорожных платформах в московском регионе.
Построена математическая модель описания и оценки степени защиты пассажиров от атмосферных осадков с использованием предложенного авторами коэффициента «сухих ног», как критерия эффективности принятия решения, учитывающего статистику аэродинамических характеристик и геометрических параметров объектов (навесов).
Представленный подход можно использовать при принятии эффективных решений о параметрах навесов при проектировании пассажирской инфраструктуры на железнодорожном транспорте.
Системы возобновляемой энергетики, такие как ветряные турбины и солнечные батареи, важны для сокращения парниковых газов и представляют собой экологически чистую альтернативу ископаемому топливу. Однако для их эффективного использования необходимо учитывать экономические, социальные, экологические аспекты, а также критерии надежности. Цель данного исследования - изучить интеграцию в энергетику на основе теории надежности, с целью обеспечения наиболее высокой точности оценок, влияющих на проектирование и принятие решений. Это включает обзор существующих методов и мер защиты, а также разработку процедур для повышения мощности и надежности энергосистем.
На сегодняшний день большое значение в электроэнергетике приобретает эффективная эксплуатация цифровых подстанций. Для этого, в первую очередь, необходимо проведение комплексных исследований различных аварийных режимов, возникающих в электроэнергетической структуре, и разработка на основе полученных результатов системы управления цифровыми объектами трансформации. Используемая в настоящее время методика расчета позволяет определить значения токов короткого замыкания (т. к. з.) с достаточной для практической цели точностью, однако она обладает существенным недостатком: для расчета токов короткого замыкания необходимо преобразовать схему замещения электрической сети к одно - или многолучевой, причем отсутствует общий алгоритм такого преобразования. В то же время существуют методы, в основе которых лежит теория графов, позволяющие определить основные характеристические функции сети, передаточные функции напряжения и тока, входные и выходные сопротивления. Одним из таких методов является метод структурных чисел. Алгебра структурных чисел позволяет создать общий алгоритм расчета характеристических функций независимо от степени сложности рассматриваемой сети.
Экономические изменения, происходящие в электроэнергетике, определяют необходимость повышения точности учета электрической энергии электрооборудования.
Решение этой задачи помогает оптимизировать затраты на электроснабжение и упорядочить расчеты по потребляемой электроэнергии, а также позволяет создать дополнительные возможности для использования энергосберегающих технологий, включая техническое обоснование затрат на производство, передачу, распределение и потребление электроэнергии.
В настоящее время сложилась «неприятная» ситуация для энергетических компаний, и она считается нормальной, когда при снижении нагрузки до 10% от номинальной происходит увеличение коммерческих потерь электроэнергии. Это связано с действующей нормативной документацией по учету электроэнергии.
Данная работа посвящена исследованию повышения точности учета потребления электроэнергии в электроэнергетических системах. Если погрешности выражаются с отрицательным знаком, то зарегистрированная энергия меньше фактической, значит, часть электроэнергии передается потребителю бесплатно. Неточности в измерениях могут привести к значительным ошибкам в техническом и коммерческом учете электроэнергии, это определяет необходимость корректировки регистрируемых значений мгновенной мощности при расчете режимов энергообъектов в соответствии с уравнениями Кирхгофа. Ошибки в измерении мгновенной мощности генераторов могут привести к неоптимальному распределению нагрузки между ними.
В работе рассмотрены возможные неточности, связанные со схемой связи измерительных трансформаторов с приборами учета.
Приведены результаты расчета погрешности, а также показана возможность выбора характеристик измерительных трансформаторов для значительного уменьшения погрешности.
В статье представлен результат моделирования значений текущего технического состояния электрооборудования на основе разработанных математических моделей. Математические модели легли в основу программного комплекса для автоматизированного расчета надежности с учетом технического состояния электрооборудования.
Для исследования надежности было принято 50 схем электроснабжения ответственных потребителей. С помощью программного комплекса было проведено моделирование текущего технического состояния электрооборудования, выраженного интегральным показателем - индексом технического состояния. Моделирование проводилось для выбранных типовых схем.
В ходе моделирования была получена выборочная совокупность значений индекса технического состояния электрооборудования. Применяя критерий согласия Пирсона, была выполнена проверка выборочной совокупности моделируемых значений на соответствие нормальному закону распределения.
Индекс технического состояния обладает свойством накопительной оценки - при увеличении числа учитываемого в процессе мониторинга электрооборудования происходит уменьшение среднего значения индекса технического состояния.
Результаты моделирования и расчетов показывают, что необходимо контролировать текущее техническое состояние электрооборудования и периодически пересчитывать значения показателей надежности схем для принятия наиболее эффективных решений о выводе электрооборудования в плановый ремонт.
Для минимизации риска повреждения электрооборудования систем электроснабжения необходима регулярная оценка технического состояния, а также регулярное техническое обслуживание и ремонт.
Для получения более точной оценки надежности необходима дополнительная информация о состоянии оборудования, например информация о проведенном техническом обслуживании, проведенном ремонте и обнаруженных неисправностях.
Полученные данные можно использовать для снижения риска простоя оборудования, увеличения частоты технического обслуживания и ремонта, а, следовательно, снижения негативных последствий отсутствия электроснабжения.
Издательство
- Издательство
- ЛГТУ
- Регион
- Россия, Липецк
- Почтовый адрес
- 398070, Липецкая область, город Липецк, Московская ул., д.30
- Юр. адрес
- 398070, Липецкая область, город Липецк, Московская ул., д.30
- ФИО
- Загеева Лилия Александровна (РЕКТОР)
- Контактный телефон
- +7 (474) 2307937