Частотный анализ словоформ

Материал из Информатика и Техники
Версия от 09:56, 16 февраля 2023; Vperlin (обсуждение | вклад) (Новая страница: «== Условие задачи == В текстовом файле записан текст на русском языке, в котором могут встречаться иностранные слова, записанные латинскими буквами. Длина текста может быть сколь угодно велика. Вывести, какая словоформа в тексте сколько раз встречается...»)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)

Условие задачи

В текстовом файле записан текст на русском языке, в котором могут встречаться иностранные слова, записанные латинскими буквами. Длина текста может быть сколь угодно велика.

Вывести, какая словоформа в тексте сколько раз встречается. Буквами считаются только буквы русского и латинского алфавита. Пробелы и знаки препинания учитывать не следует.

Указания к решению задачи

Словоформой считается всякая последовательность букв, состоящая только из русских или только из латинских букв. При этом строчные и прописные буквы не различаются (считаются за одну букву), даже если это противоречит правилам грамматики.

"Слова", записанные русскими и латинскими буквами вперемешку, а также "слова", содержащие цифры, учитывать не следует.

Следует учесть, что дефис может являться частью словоформы: "кое-кто", "далеко-далеко" и тому подобное. Дефис следует отличать от тире по тому признаку, что справа и слева от него не может быть пробелов и иных знаков препинания.