正規表現

作るのに苦労した正規表現をメモ。

<a href=”#” …> の中から特定の属性だけを抜き出す

後で詳しく書く
python

ptn = r'<a((?:(?!\s+class=(?:(?:"[^"]*")|(?:[^\s>])))\s+[^\s=]+=(?:(?:"[^"]*")|(?:[^\s>]*)))*)(?:(\s+class=)(?:(?:"([^"]*)")|([^\s>]*)))?(.*?)>(.*)'

program/正規表現 (最終更新日時 2014-06-12 15:09:06 更新者 dossist)