Бувають випадки коли ви маєте якусь сторінку HTML і вам конче потрібно перевести її у звичайний текст. Оскільки вручну видаляти всі позначки HTML - це марудна справа, ви можете одразу відкрити файл *.html у Vim для редагування і виконати:

%s/<[^>]*>//g

Останнє видалить всі теги на зразок <html>, <body>, <table> і так далі.

Якщо ви звернете увагу на регулярний вираз, то зрозумієте що він має одну хитрість, а саме - шукає лише вирази із відкриваючою < і закриваючою >, оминаючи знак >. Це обмежує співпадання лише до справжніх позначок.

Частою помилкою початківців є написання подібного виразу заміни як %s/<.*>//g. Останній створює те що в регулярних виразах називається "жадібним виразом", який співпадає із більшим ніж ми мали на увазі. Тобто, він співпаде з усім аж до наступного закриваючої мітки >:

<b>Some important text we are interested in.</b>
^                                              ^

Явно не те що нас цікавить.

Після видалення міток HTML, вам, можливо захочеться поміняти помітки &quot; &amp;, &lt; і &gt;, прийняті у HTML у відповідні знаки &, < і >, це не складно:

%s/&lt;/</g

Також, може виникнути бажання видалити порожні рядки що повинні утворитись у очищеному файлі HTML:

g/^\s*$/d

У цьому випадку, вказівник адреси g вказує шукати по всьому файлу, тоді як команда d видалить рядок, що, можливо, містить лише пробіли (\s).

Пам'ятайте, що ви завжди можете скасувати ваші зміни до того як вони були збережені командою :u. Накінець, збережіть файл, але вже без закінчення .html, можливо .txt.