Уникальность текста: что такое пассажи и шинглы?
Сегодня мы говорим об уникальности буквально на каждом шагу: и сумочку, чтоб была только у меня, подавай, и индивидуальные подарочки на заказ делаем, и платья по своему крою шьем, и концепцию маркетинга мы разрабатываем, отличную от конкурентов, и товары-то у нас все узко дифференцированные! Дорвались, что называется! А над одинаковостью вещей мы можем позволить себе посмеяться лишь раз в год, когда показывают «Иронию судьбы». Еще для разнообразия можно сходить на флэшмоб – все в белых майках, но в целом, похожесть под запретом, более того, слишком уж явная похожесть и вовсе именуется плагиатом.
В мире Интернета ситуация обстоит ни чуть не иначе. Разработчики сайтов тщательно изучают сайты своих конкурентов и стремятся изобразить нечто оригинальное. То же касается и контента. Бдительные специалисты по продвижению каждые пять минут напоминают своим копирайтерам, чтобы те писали тексты уникальные, неповторимые, ни капли не напоминающие другие тексты. А связано это вот с чем. Казалось бы, ну скопировал статью с конкурента, опубликовал у себя, авось пользователь не заметит, а если и заметит, то поди разбери, кто у кого украл и кто написал первым. Вряд ли клиент станет упрекать в плагиате, другой вопрос, что конкретно о Вас он ничего нового не узнал и выберет скорее всего те услуги, что подешевле. Вся эта суматоха с уникальными текстами связана совершенно с другими «читателями». Этими «читателями» являются поисковики, которые отслеживают похожие тексты и могут окрестить их, как спам или плагиат.
Для проверки текста на уникальность применяются шинглы и пассажи. На них мы остановимся подробно.
Шинглы (дословно с английского – чешуйки) – это своеобразное разбивание текста на маленькие части примерно по 5-6 слов. Слова эти преобразовываются в двоичный код, анализируются и сравниваются с другими текстами. Метод шинглов позволяет досконально проверить текст, так как в цепочке последовательных слов последнее слово будет являться первым для новой цепочки.
Пассажи – это цепочки слов из 5-10 слов. Таким образом, вводя одно предложение их текста в поисковик, он может выдать или не выдать несколько текстов, имеющих такие же предложения. Если, скажем, 4 слова из 8 будут совпадать с другим текстом, то релевантность будет равна 50%.
Очень часто копирайтеры переписывают тексты, максимально сохраняя смысл, но жонглируя синонимами. Это один из способов сделать текст уникальным. Еще один способ – это переставить предложения местами, но логичность текста резко потеряется.
Так же иногда просто меняют каждые 3-4 слова на другие. Можно попробовать изменить род, число, падеж и время. Все эти способы можно сравнить с перешиванием других пуговиц на платье, прикалыванию новых аппликаций, окраской и другими трансформациями платья. Но если Вы хотите получить полностью уникальный текст, нет ничего лучше, как написать его самостоятельно, с чистого листа. Конечно, хорошие статьи стоят дорого, но эта цена оправдывает себя своим качеством и оригинальностью. Задумайтесь, хотели ли бы Вы ходить в таком же платье, как у всех, только с другими карманами?

