|
|
|
| Здравствуйте, помогите с регуляркой, цель скормить скрипту адрес сайта, и получить массив по одному слову только из русских букв.
Если парсить кусок текста то всё хорошо, если с URL то не парсит, подскажите что не так??
$text = "но и решил важнейшую национально-культурную задачу — синтез языковых стилей и создание нового национального литературного языка.";
$url = "http://www.rvb.ru/pushkin/";
$page = file_get_contents($url);
preg_match_all('/([\p{Cyrillic}]+)/iu', $text, $m);
print_r($m);die;
|
| |
|
|
|
|
|
|
|
для: maloi_m3
(17.06.2015 в 14:02)
| | Проблема была решена таким образом.
$url = "http://www.rvb.ru/pushkin/";
$page = file_get_contents($url);
$page = iconv ("CP1251", "UTF-8", $page);
preg_match_all('/([\p{Cyrillic}]+)/iu', $page, $m);
print_r($m);die;
|
| |
|
|
|