Тут конечно есть недостаток (или достоинство) - результат получается отсортированный по алфавиту, но мне например это не важно. Еще отличие от kwk - повторы сохраняются в отдельный файлик.
Сегодня причесал немного скрипт, добавил автоопределение кодировки (входящие файлы могут быть или в win1251 или utf-8) и вот решил выложить.
Собственно, скрипт качать здесь
(жмем там кнопочку download и получаем bat-файл)
Как пользоваться:
- передать батнику файл аргументом (берем свой текстовый файл и просто пересовываем его мышкой на smf_sortcleaner.bat в проводнике windows), все остальное он сам сделает и создаст в папке с собой два файла, очищенный и повторы. А если просто запустить скрипт, без аргументов в смысле, то он обработает все .txt в папке с собой.
Требует для работы .net framework 2.
Исходный код открыт, можете переписывать под себя хоть в блокноте.
Камрад! Ты не представляешь, как мне облегчил жизнь!
ОтветитьУдалитьПремного благодарен! Респект!
Перепробовал много программ под винду, предназначенных для удаления дубликатов, так толком ни одна и не справилась и единственным решением оставалось ставить линукс систему и копатся там в терминале.
ОтветитьУдалитьА тут случайно наткнулся на вашу статью которая меня просто выручила, как я сам не додумался до АСорт.
Спасибо Вам огромное!
Очень, очень был рад такому скрипту, спасибо!
ОтветитьУдалитьСпасибо. Очень нужная вещь
ОтветитьУдалитьОгромное спасибо за этот скрипт!
ОтветитьУдалитьСпасибо. Очень нужная вещь,очень был рад такому скрипту, спасибо!
ОтветитьУдалитьА можете создать батник на этой основе, чтобы например все строки дубликатов и их дубликаты перемещались в отдельный текстовый документ.
ОтветитьУдалитьнапример есть тектовый документ с некой базой:
abcde
abcde
sdret
sdeen
derty
derty
derty
gytuo
frtyh
lmnkh
Из этой базы выловить и изъять все одинаковые строки, затем переместить их в другой текстовый документ:
abcde
abcde
derty
derty
derty
Заранее спасибо.
Мужик ты мне просто жизнь облегчил!!!!!!!!!
ОтветитьУдалитьКрасавец!!!!!! Спасибо тебе огромное!!!!
ОтветитьУдалитьС уважением!!!
Хорошая вещь!!!!
ОтветитьУдалитьа его можно настроить,чтобы он из первого файла удалял те слова,которые будут записаны во второй?
Работает, спасибо!
ОтветитьУдалитьПерезалейте пжл!
ОтветитьУдалитьНизкий тебе поклон добрый человек:)
ОтветитьУдалитьНа файле размером в 5G и оперативке в 4G - не пошло.
ОтветитьУдалитьСпасибо! Unified List Manager выдал ошибку, а этот скриптик справился с файлом (700 мб).
ОтветитьУдалитькласс ! спасибо !
ОтветитьУдалитьСпасибо, ОЧЕНЬ помог
ОтветитьУдалитьхуй вирусы
ОтветитьУдалитьСпасибо тебе, добрый человек! Надеюсь, ты заработал (украл, нашёл, подарили...) 100500 единиц бабла и именно поэтому больше не пишешь. :)
ОтветитьУдалитьСпасибо! Класс!
ОтветитьУдалитьСупер!
ОтветитьУдалитьс файлом в 1,5 Гиг. не справился вылетает ошибка программа не работает.Железо 8 гиг.оперативки 6-ти ядерный проц.
ОтветитьУдалитьОчень благодарен! Ты мне сделал жизнь легче в 100 раз!
ОтветитьУдалитьНу и на фига эта хрень нужна ?
ОтветитьУдалитьВот зачем ?
Ведь тоже самое делается в cmd в одну строчку.
супер скрипт! благодарочка от меня!!!
ОтветитьУдалитьХорошая идея - запихнуть функционал в батник. Для простых манипуляций еще нашел прогу - Duplicat Remover by teso (http://ebaza.pro/file/13546327). В нагрузку к KeyWordKeeper...
ОтветитьУдалитьА перезалейте файл, плиз.
ОтветитьУдалитьготово
УдалитьБольшое спасибо!!!)
ОтветитьУдалить