|

 Проверить аттестат
|
|
|
|
|
Вот это и случилось!

Синонимы - это прошлый век!
Начинается продажа самого мощного рерайтера в интернете!
Сразу говорю, что ничего подобного вы не видели!
Главное отличие рерайтера текстов MyMonster от сотен других в том, что абсолютно все слова остаются на своих местах без замены, а уникальность придается путем внесения в текст новых слов, которые так или иначе качественно характеризуют различные части речи.
Была проделана просто колоссальная работа! Собрано огромное количество материала! Отпарсены десятки источников!
Все консультации и демо в аське 282412513 (можно писать в офлайн).
Основная суть проекта MyMonster
Внесение дополнительных слов в текст, обеспечивающих достаточный уровень уникализации.
Рерайтер текстов MyMonster содержит 3 уникальные базы, это:
- База Прилагательные
- База Глаголы
- База Сочетания слов
Короткий, но наглядный пример на русском языке
Есть предложение:"Я хочу купить дорогой подарок своей любимой."
На выходе получится что-то вроде:"Я хочу срочно купить необычайно дорогой подарок своей горячо любимой."
Замены:
1. купить => срочно купить (замена по базе Глаголы)
2. дорогой => необычайно дорогой (замена по базе Прилагательные)
3. любимой => горячо любимой (замена по базе Сочетания слов)
Можно уверенно сказать, что новый текст гораздо более читабелен в литературном смысле, чем сам исходник.
Про шинглы вообще молчу!
И очень важно, что не произошло никаких глупых замен, типа купить-укупить, дорогой-дражайший, подарок-гостинец и т.п.
Купить можно ниже...
Справка
MyMonster под RU
- База Прилагательные - 27840 прилагательных и 22 качественных наречия, сочетающихся с прилагательными
- База Глаголы - 3228 глаголов и 31 качественных наречия, сочетающихся с глаголами
- База Сочетания слов - 3337 строк, по 2-5 правильных русских сочетаний слов
Обоснование
Все известные мне уникализаторы и синонимайзеры построены по принципу замены одних слов на другие. Редко когда замена пройдет без искажения текста, поэтому при синонимизировании всегда очень страдает читабельность текста.
Я пошел другим путем!!!
В любом языке мира существуют отдельные части речи - это существительное, прилагательное, числительное, местоимение, глагол, наречие, предлог, союз и частица.
Мною были выбраны 2 части речи - прилагательное и глагол.
Прилагательное - часть речи, обозначающая признак предмета и отвечающая на вопросы: какой? какая? какое? какие? Изменяется по родам, числам и падежам. Прилагательные бывают - качественные, относительные, и притяжательные.
В качестве основы для базы прилагательных были выбраны качественные прилагательные.
Качественные прилагательные обозначают безотносительное свойство самого предмета, способное проявляться с разной интенсивностью.
Глагол - часть речи, обозначающая действие или состояние и отвечающая на вопросы: что делать? что делает? что делал? что будет делать? Формы глаголов - инфинитив, причастие, действительное причастие, страдательное причастие, деепричастие.
В качестве основы для базы глаголов была выбрана форма глагола инфинитив.
В качестве основы для базы сочетания слов были выбраны наречия и наречные выражения в высокой степенной значимости.
Описание
Скрипт MyMonster имеет 3 поля - верхнее, среднее, нижнее.
Верхнее поле служит для ввода текста.
Среднее и нижнее поля служат для визуального сравнения текста до и текста после рерайтинга.
Характеристики
В нижнем поле слова, которые были дополнены имеют 3 цвета - зеленый, синий, красный.
Зеленый цвет - им обозначаются только слова, добавленные по базе прилагательных.
Синий цвет - им обозначаются только слова, добавленные по базе глаголов.
Красный цвет - им обозначаются сочетания слов. Причем и то слово, которое было, и то слово, которое было добавлено.
Особенности
Основная особенность скрипта MyMonster в том, что обработка текста осуществляется построчно, т.е. добавление к одному и тому же слову в разных предложениях будет разным с вероятностью 98-99%.
Проделанная работа
1. Было напарсено 50Гб русского текста и 47Гб английского текста.
2. Был разработан уникальный алгоритм распознования частей речи.
3. С помощью алгоритма распознования частей речи были обработаны напарсенные тексты.
4. Были разработанны леммы и частотность. Лемма - отношение слова к определенной части речи. Частотность - повторение слова на 100 000 слов.
5. Был введен коэффициент D, как отношение леммы к частотности.
6. В словари попали только слова, имеющие коэффициент D более 0,5.
7. Прилагательные и глаголы были прогнаны по всем падежам и временам.
8. Были отсеены слова с двойным значением.
|
|
|
|
|