Перейти на главную страницу

Главное меню

Перечень разделов новостей..


 

Друзья

Наши друзья

» sapeua.com

 

Последние новости RSS-лента

Обзор программ для проверки контента на уникальность (плагиат)

представляю вашему вниманию программы, которые позволят обнаружить дублированный контент в Интернете.

1)  Double Content Finder (DC Finder) —  одна из самых известных программ для проверки текста на уникальность. Разработана программистами биржи контента TextBroker в 2007 году, программа периодически обновляется. Последний релиз, который мне удалось найти, за 2008 год.

Скачать программный продукт можно по этой ссылке,  размер дистрибутива  совсем небольшой, около 400кб, большим плюсом является то, что не требуется установка, программа запускается обычным exe файлом.

Ниже приведен скрин  программы, который вы увидите при запуске.

программа для поиска дублированного контента DCFinder

Проверить текст на уникальность можно любым из трех способов  – из текстового файла (работает только с .txt файлами), задав нужный вам url, где расположен материал или ручным вводом – скопировав часть текста через буфер обмена.

В итоге вы можете получить два варианта ответа: либо текст уникален, либо вы увидите список url – адресов, на которых найден проверяемый отрывок.

программа для поиска дублированного контента (плагиата) DCFinder

Мне понравились результаты проверки программы. Проводилось порядка 10 экспериментов, везде результат оказывался очень и очень похожим на правду.


2) Advego Plagiatus —  программа, созданная разработчиками биржи контента Advego для поиска в интернете копий текстовых документов. В отличие от предыдущей рассмотренной программы она требует установки, что для меня является минусом – ну не люблю я устанавливать на свой компьютер всякое непроверенное ПО.

Предусмотрена возможность проверки текста на уникальность как скопированного через буфер, так и расположенного в Интернете. По результатам работы программы выдается результат в виде перечня ресурсов, на которых была обнаружена копия, и процентного соотношения найденных сопадений на этих ресурсах.

программа для поиска копий текста (плагиата) в Интернете Advego Plagiatus

Настроек у программы не очень много, несомненным плюсом является возможность соединения через прокси. Дистибутив  программы имеет размер около 1,2 Мб. Скачать программный продукт можно на этой странице.

3) Praide unique content analyzer  – наименее известная, но самая функциональная по своей задумке программа для поиска дублированного текста.

Скачать ее можно непосредственно на сайте разработчиков, дистрибутив весит порядка 4 мб,  а почитать историю появления и проследить процесс совершенствования программы — на всем известном  форуме о поисковых системах.

Как и в предыдущих рассмотренных программах, есть возможность проверки скопированного текста через буфер обмена и посредством импорта материала из текстового файла. Также вы можете проверить текст уже расположенный на веб-странице в Интеренете… Как пользоваться этой программой? 

В настройках можно выбрать два способа проверки – либо попассажно (текст разбивается на фразы длинной от пяти до десяти слов, которые затем ищутся в поисковых системах), либо шинглами (материал делится на фразы длиной, равной заданной длине шингла, «внахлест», т.е. второе слово в предыдущей фразе является первым в следующей, и затем также осуществляется поиск в поисковых машинах). Например, возьмем текст из моего предыдущего обзора:

«В последнее время бизнес в Интернет сфере развивается семимильными шагами. Если раньше достаточно было просто создать сайт своей организации или фирмы, разместить в Интернете – и …»

и зададим проверку текста попассажно с длиной пассажа в 5 слов (для упрощения стоп-слова будем также считать словами). Тогда объектами проверки будут:

- В последнее время бизнес в;
- Интернет сфере развивается семимильными шагами;
- Если раньше достаточно было просто;
- создать сайт своей организации или;
- фирмы, разместить в Интернете – и;

Если мы выберем метод проверки шинглами и зададим величину шингла равной 7,  то этими самыми шинглами будут словосочетания:

- В последнее время бизнес в Интернет сфере;
- последнее время бизнес в Интернет сфере развивается;
- время бизнес в Интернет сфере развивается семимильными;
- бизнес в Интернет сфере развивается семимильными шагами;
- в Интернет сфере развивается семимильными шагами. Если;
- Интернет сфере развивается семимильными шагами. Если раньше;

ну  и так далее до конца текста. Для каждого шингла рассчитывается контрольная сумма (или “сигнатура”) – это уникальное число, поставленное в соответствие каждой уникальной фразе, которая составляет шингл. После этого из всего множества полученных контрольных сумм (а их столько, сколько слов в документе минус величина заданного шингла, в нашем случае семь, и плюс один) выбираются только те, которые делятся, например, на 14.

Если есть повтор даже одного шингла, т.е. идущих подряд семи слов – уже велика вероятность скопированного текста. Если же таких совпадений много – значит вы с очень большой вероятностью нашли копию проверяемого текста.

Соответственно, время проверки с помощью программы Praide unique content analyzer напрямую зависит от введенных вами параметров и размеров текста – чем больше тест и меньше размер пассажа либо шингла, тем больше время поиска.

Также в настройках программы есть опция защиты вашего IP адреса – между каждым запросом программы к поисковым системах делается пауза в несколько секунд, чтобы при частом обращении поисковые системы не решили, что вы робот и не занесли ваш IP в черные списки.  Особая гордость разработчиков – возможность самостоятельно выбирать поисковые системы, включая большое количество ПС буржуйнета,  в которых будет производиться поиск.

После настройки всех необходимых вам параметров, выбирайте «Выполнить запрос» и запасайтесь терпением.

программа для поиска копий текста (плагиата) в Интернете Praide unique content analyzer

Результаты работы программы представлены ниже:

программа для поиска скопированного контента в Интернете Praide unique content analyzer

Для того, чтобы просмотреть, где же именно находятся материалы, которые программа посчитала сходными с заданным текстом, в таблице результатов  нужно дважды кликнуть на интересующую вас ячейку. У меня выделена ячейка со значениями «Рады представить вашему вниманию нашу разработку Doub….» в поисковой системе Google, с количеством совпадений  1820. 

Дважды кликнув по этой ячейке, мы автоматически переходим в интересующий нас поисковик и видим результаты совпадений по выбранной фразе.

программа для поиска скопированного контента в Интернете Praide unique content analyzer

Большим удобством является  возможность вывода результатов работы программы на печать. Также, если во время работы с программой возникли какие-то вопросы, можно воспользоваться встроенной в программу помощью.

Вот,  пожалуй,  и все настольные программные продукты для поиска дублированного контента, которые есть в свободном доступе в Интернете на текущий момент. На мой вкус, пользоваться on-line сервисами гораздо быстрее и удобнее, хотя в программах есть такие плюсы, как встроенная помощь и возможность распечатать результаты проверки.

В заключении, хотелось добавить, что целью данного обзора было протестировать всевозможные настольные программы для поиска плагиата, и что все мнения по поводу удобства \ быстроты \ качества работы программ – сугубо индивидуальные. Все замечания и предложения только приветствуются. В любом случае, каким методом для поиска дублированного контента пользоваться, решать только вам.




 (голосов: 0)

Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.
Теги:
Просмотров 395

добавить Добавление комментария











Авторизация

Войти на сайт..

Ваш паспорт: пройдите авторизацию

Авторизация

Пароль есть, но Вы его забыли?
Впервые на сайте? Зарегистрируйтесь!

 

Календарь

«    Май 2012    »
ПнВтСрЧтПтСбВс
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
 

 

Популярные

Самые рейтинговые..


 

Архив новостей

Тут тоже много интересного..

Август 2010 (1)
Июль 2010 (1)
Июнь 2010 (1)
Май 2010 (68)
Апрель 2010 (5)
Январь 2010 (2)

 

Статистика

Немного инфы..



Счётчик

Счётчик

Счётчик

 
Размещение рекламы | Контакты
Публикуемые текстовые материалы предоставлены здесь только для ознакомления. Все права на них принадлежат их владельцам.
Copyright © 2009-2010. Sapeua.com - система заработка, библиотека заработка. Монетизация, заработок на сайте.