[첫화면으로]"Perl/Web-Scraper" 페이지의 변경 내역

마지막으로 [b]


현재 버전 . . . . 2014-4-18 11:06 pm 수정한 사람: Raymundo [복원]
27 번째 수정본 . . . . 2014-4-17 8:59 am 수정한 사람: 213.238.175.xxx
26 번째 수정본 . . . . 2012-2-22 9:28 pm 수정한 사람: Raymundo
 

변경사항 (가장 최근의 "일반적인 수정"부터) (다른 변경사항 없음)

-285,8 +285,6
매번 html 전체 구조를 파싱하고 트리구조를 생성한 후 거기에서 원하는 노드를 찾아가는 형태이다보니, 정규표현식으로 한번에 원하는 곳을 집어내는 것에 비해서 매우 느리다. 웹페이지 전체를 가지고 처리하지 말고 일단 불필요한 부분을 제거한 후에 남은 내용을 가지고 처리하게 하는 것이 좋다. <mysign([[Raymundo]],2010-2-24 6:04 pm)>
html 자체에 오류가 있는 경우 (태그에 속성 이름이 잘못되었다거나, 따옴표나 괄호가 제대로 매치가 안 된다거나...) scrape()과정에서 die를 해 버리니 좀 불편하다. 추출은 못 하더라도 굳이 die까지는 안 해도 될 것 같은데. <mysign([[Raymundo]],2012-2-22 9:28 pm)>
These are record of subscribers who include choose benefit when you buy website adult traffic traffic. That means you have to "pretty" it up and user is searching for and help you to get the target consumers to your site.   <a href="http://theakingroup.com/">buy visitors</a> <mysign(Hibraned,2014-4-17 8:59 am)>
<longcomments(100)>
----