一般在个网站中最适合堆砌文章列表的就是<ul><li>标签,型如以下的形式:
ull标签+li标签
<ul> <li>……<li> <ul>
这样可以获取一个文章的主要内容列表,那也不用管他们的是怎么分布在什么地方只要输入网址,他就自动找出li标签部分,然后目测出是否是主要的列表部分内容,然后就可以使用正则OOXX 采集了吧,
...
一般在个网站中最适合堆砌文章列表的就是<ul><li>标签,型如以下的形式:
ull标签+li标签
<ul> <li>……<li> <ul>
这样可以获取一个文章的主要内容列表,那也不用管他们的是怎么分布在什么地方只要输入网址,他就自动找出li标签部分,然后目测出是否是主要的列表部分内容,然后就可以使用正则OOXX 采集了吧,
...