|
|
|
| В тексте иногда встречаются очень длинные анкоры, часто не дающие ничего читабельности, обычно это автоподставленные ссылки на plain urls:
<a href="http://en.wikipedia.org/wiki/Minaret_controversy_in_Switzerland">
http://en.wikipedia.org/wiki/Minaret_controversy_in_Switzerland
</a>
|
или
<a href="http://www.google.com/search?hl=en&client=firefox-a&rls=com.ubuntu%3Aen-US%3Aunofficial&hs=wV3&q=ubuntu+cron+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D0%BC%D0%B8+%D0%B7%D0%B0%D0%B4%D0%B0%D1%82%D1%8C+%D0%B8%D0%B7+%D0%BA%D0%BE%D0%BD%D1%81%D0%BE%D0%BB%D0%B8&aq=o&oq=&aqi=">
http://www.google.com/search?hl=en&client=firefox-a&rls=com.ubuntu%3Aen-US%3Aunofficial&hs=wV3&q=ubuntu+cron+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D0%BC%D0%B8+%D0%B7%D0%B0%D0%B4%D0%B0%D1%82%D1%8C+%D0%B8%D0%B7+%D0%BA%D0%BE%D0%BD%D1%81%D0%BE%D0%BB%D0%B8&aq=o&oq=&aqi=
</a>
|
задача - определить, что анкор внутри начинается с http - и обрезать его, оставив от анкора только домен -
<a href="http://www.google.com/search?hl=en&client=firefox-a&rls=com.ubuntu%3Aen-US%3Aunofficial&hs=wV3&q=ubuntu+cron+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%B7%D0%B0%D0%B4%D0%B0%D1%87%D0%B0%D0%BC%D0%B8+%D0%B7%D0%B0%D0%B4%D0%B0%D1%82%D1%8C+%D0%B8%D0%B7+%D0%BA%D0%BE%D0%BD%D1%81%D0%BE%D0%BB%D0%B8&aq=o&oq=&aqi=">
http://www.google.com/...
</a>
|
мои потуги наплодили каких-то уродцев, даже приводить примеры стыдно :( | |
|
|
|
|
|
|
|
для: kikaha
(21.10.2009 в 15:00)
| | Да я-бы не сказал что вообще бывают красивые регулярные выражения :)
просще наверное будет просто сразу искать ссылки с http://
типа '#<a\b[^>]*\bhref=["\']?(http://[^/\s"\']+)#i'
, тоже страшновастенькое получается ,) но со временем как-то становится главным чтобы работало
, оптимизировать тоже иногда надо , но до этого обычно не доходит | |
|
|
|
|
|
|
|
для: heed
(21.10.2009 в 21:27)
| | вот такая конструкция вроде бы успешно сокращает:
echo preg_replace('~<a[^>]+href="(.*?)"[\s\b\t]*>(.*?)<\/a>~is', '<a href="$1">[short anchor]</a>', $str); | |
|
|
|