Форум: Форум PHPФорум ApacheФорум Регулярные ВыраженияФорум MySQLHTML+CSS+JavaScriptФорум FlashРазное
Новые темы: 0000000
PHP 5. На примерах. Авторы: Кузнецов М.В., Симдянов И.В., Голышев С.В. PHP Puzzles. Авторы: Кузнецов М.В., Симдянов И.В. PHP 5/6. В подлиннике. Авторы: Кузнецов М.В., Симдянов И.В. PHP на примерах (2 издание). Авторы: Кузнецов М.В., Симдянов И.В. Самоучитель PHP 5 / 6 (3 издание). Авторы: Кузнецов М.В., Симдянов И.В.
ВСЕ НАШИ КНИГИ
Консультационный центр SoftTime

Форум PHP

Выбрать другой форум

 

Здравствуйте, Посетитель!

вид форума:
Линейный форум Структурный форум

тема: Создание парсинга с нуля на PHP
 
 автор: AlexanderIT   (20.10.2012 в 15:12)   письмо автору
 
 

Здравствуйте!
Мне нужно с нуля создать парсинг с занисением информации в базу данных на MySQL(база данных тоже создаётся с нуля).
Задача : Есть сайт. На сайте есть резюме. Это резюме мне нужно поместить в базу данных. Также в коде парсинга должен быть цикл поиска информации (резюме) на 5 страницах. В результате должна получиться база данных с полями текста из каждого резюме и возможность печать этой информации из базы данных
вопрос : Как это можно реализовать кодом на PHP 5 версии?

  Ответить  
 
 автор: cheops   (20.10.2012 в 17:45)   письмо автору
 
   для: AlexanderIT   (20.10.2012 в 15:12)
 

Вам нужно создать спроектировать таблицы базы данных, в скрипте проверить их наличие - если они отсутствуют, разворачиваем, если присутствуют, приступаем к разбору данных. Загружаем страницу при помощи одной из файловых функций, например, file_get_contents(), далее извлекаем из полученной строки нужную информацию (например, при помощи регулярных выражений) и сохраняем её в таблице базы данных (страниц 5, значит должно быть пять вызовов функции file_get_contents()).

Понятно, что это сжатое описание порядка действий, лучше всего разбить вопрос на ряд мелких, на которые посетителям будет не сложно ответить и завести под каждый из них отдельную тему.

  Ответить  
 
 автор: AlexanderIT   (20.10.2012 в 17:55)   письмо автору
 
   для: cheops   (20.10.2012 в 17:45)
 

для начала нужно писать не код для взятия информации а создать таблицы.
Тогда такой вопрос а как потом к 1 резюме привязать 1 созданную таблицу?
получается это нужно в коде прописывать эту связь
и ещё вопрос с чего лучше начать?

  Ответить  
 
 автор: cheops   (20.10.2012 в 18:11)   письмо автору
 
   для: AlexanderIT   (20.10.2012 в 17:55)
 

Не совсем так, таблицы обычно проектируют таким образом, чтобы одна запись таблицы соответствовала одному резюме. В этом случае у вас будут плодиться не таблицы, по массе которых очень сложно осуществлять поиск, а записи таблицы - для работы с ними и поиску по ним имеется масса разнообразных инструментов.

Связь осуществляют по-разному, обычно просто вставляют запись, иногда строят модель-класс, который инкапсулирует работу с базой данных. Зависит от задач, которые ставятся перед приложением и необходимостью его дальнейшего приложения. Вам лучше всего сначала построить прототип - т.е. минималистское приложение, которое не обременено сложной архитектурой, тем более вы вероятно будете пока один сопровождать этот проект.

Такие приложения обычно начинают с проектирования базы данных.

  Ответить  
 
 автор: AlexanderIT   (20.10.2012 в 18:19)   письмо автору
 
   для: cheops   (20.10.2012 в 18:11)
 

спасибо всё понял!
По заданию есть 1 страница с 1 резюме с сайта. В полях этого резюме хранится информация которую нужно занести в базу данных на MySQL. Как я понял мне для начала нужно спроектировать хотя бы одну таблицу в MySQL и увидеть как в ней будет храниться информация взятая с сайта(с полей в форме резюме)
К примеру я увидел как это будет храниться всё это.
Как мне тогда начать писать код на php? Есть ли Примеры написания чего-то похожего?

  Ответить  
 
 автор: cheops   (20.10.2012 в 21:01)   письмо автору
 
   для: AlexanderIT   (20.10.2012 в 18:19)
 

Я так понимаю, резюме будет несколько, как вы планируете получать их список? Адреса страниц будут заданы заранее или список тоже нужно будет получить со страниц сайта?

  Ответить  
Rambler's Top100
вверх

Rambler's Top100 Яндекс.Метрика Яндекс цитирования