Суть - попытка нормализовать текст после того, как спамеры начинают пихать пробелы, чтобы обойти шаблоны.
Первая идея была вообще пробелы убрать, но "продам" и "про дам" все же совсем разные вещи.
тут, видимо, все же отсутствует двойной пробел, потому слово без разделений должно получиться, я потому и обратился за помощью, что задача пока выглядит нерешаемой, особенно в рамках моментальной оценки
Цитата: volk13 ➤ Просто тексти еще текст
вот, да, видимо, эти ложные срабатывания придется принять, как данность... и это еще несмертельно...
Сначала думал просто считать отношение количество одиночных и двойных пробелов к общему количеству символов и, если их достаточно много, то просто вообще убирать все одиночные пробелы, но, что-то мне кажется, это не будет работать, особенно в варианте, когда пробелами разделяется только спам-слово. Был еще вариант в голове, идем с конца строки, и если символ в текущей позиции и пробелы справа и слева, то пробел справа удаляем. Это как раз, как мне кажется, даст вариант вроде "тексти"