Выдераем ссылки из текстового файла с помощью Notepad++

notepad++Редактор Notepad++ лучший в своем роде. Целый день я убил на изучение регулярных выражений в программе Notepad++ Цель —  понять как в текстовом файле выделить все ссылки и скопировать их в отдельный список. В итоге, в самом конце мучений интуитивно пришел к такому не хитрому действию:

1. Сначала сделаем каждую ссылку отдельной строкой. Для этого в «поиске- заменить» вводим  в поле «найти» : http в поле»заменить» \nhttp. Режим поиска ставим «Расширенный». Нажимаем «Заменить все». Мы получили ссылки в отдельных строках.

2. Выделяем регулярными выражениями (http)(.*)(jpg) все ссылки (поиск-пометки) ставим галочку «Помечать закладки». Редактор выделяет все сторик начинающие с http и заканчивающие jpg

3. Далее нам нужно скопировать строки помеченные закладкой. Для этого в меню выбираем Поиск- Управление закладками- Копировать все строки с закладкой. Все готов, в буфере мы имеем список ссылок. Далее вставляем куда вам угодно.

Синтаксиси регулярных выражений Notepad++:
. – Точка представляет один любой символ
[abc] – перечень символов. Совпадёт с буквами a, b, или с
[^abc] – перечень символов, которые не входят в диапазон. Совпадёт с любым символом, кроме a, b, или с
* — «Повторитель». Означает, что предшествующий символ может повторяться (0 или более раз)
[abc]* — найдёт идущие подряд символы из набора. Например, abracadabra
[^abc]* — с точностью до наоборот. abracadabrrra
.* — Абсолютно любой набор символов. «.*» – найдёт все подстроки между кавычками
^ — начало строки (если исп. В начале выражения)
$ — конец строки
\w – буква, цифра или подчёркивание _
\d – Любая цифра
\D – Любой символ, но не цифра
[0-9] – Любая цифра
[a-z] – Любая буква от a до z (весь латинский набор символов) в нижнем регистре
[A-Z] – Любая буква от a до z в ВЕРХНЕМ регистре
[a-zA-Z] – Любая буква от a до z в любом регистре
[a-Z] — То же самое

([а-яА-Я]) — выделяет все русские буквы

([а-яА-Я]+) — выделяет все русские слова

img src=»[^»]*» ищет от img src= до первых кавычек и до вторых
сортировка по алфавиту: TextFX — TextFX Tools — Sort lines case sensitive (at column)(сортировать с учётом регистра)
— Sort lines case insensitive (at column)(сортировать без учёта регистра)
  • Иванушко Кошкен

    Спасибо. Эта ваша статья открыла для меня Notepad++. Презабавная вещица. «Инвертировать закладки», «Выделение столбцом» — вы не представляете, как я исстрадался по этим простым вещам, нужным мне постоянно. Короче, я в восторге. Ещё раз спасибо.