YAHOO!的股市研究報告
原RSS網頁:http://tw.stock.yahoo.com/rss/url/d/e/R2.html
template: 200705/mobile01-841001200899bbbf0e55a81058ef63fe.zip
附圖:


不過文章內容多了一些不想要的東西
不知道怎麼改掉
有哪位大德能幫我修一下嗎??
歡迎光臨我的網站
行動最愛網 http://i-favorites.net
小弟根據新鏈結改了一下,給需要的人參考。
UDN news....
附加壓縮檔: 200705/mobile01-ddabbad249e9e35d1fb9240fb99f2474.zip
他們最近改版了,這邊寫了2個Template,提供給喜歡的人
1. Wired_culture.xml (這個是直接連http://www.wired.com/culture這兒抓)
資料應該會全下,有些文章是有附圖的,這裏只抓部份的小圖
2. Wired_RSS.xml (這是依他的RSS的分類去抓)
這資料就不一定全正確
附加壓縮檔: 200705/mobile01-7c2ac4cc12d3f591608ad7eeab9af801.zip
簡體版的Template
來源
新浪女性-焦点新闻
http://rss.sina.com.cn/news/allnews/eladies.xml
附加壓縮檔: 200705/mobile01-437d2c4f5e37c069a3de54b95c3e49f3.zip
前面的範例好像都只有抓單一欄位來當TITLE(還是叫HEADER)
像是我要抓取這一個網頁:
http://money.hinet.net/Z/ZD/ZDC/ZDCnew_E_E_E_E_E_1_D.DJHTM
在定義channel時
想要前兩個欄位(標的、標題)都抓進來當作我的TITLE
但是以標題這一欄的連結來抓取article
語法應該如何修改?
目前寫出來的語法:
麻煩幫我指正一下~
<parse_channel>
<![CDATA[
var d = new Document(channel.url,"big5");
var tags = d.getElementsByTagName("a");
for (i in tags)
{
var gettitle = "";
var href = tags[i].getAttribute("href");
if ( href
&& href.indexOf( "/z/zd/zdc/zdcz/zdcz_" ) != -1)
{
var article = new Article();
article.date = new Date( (new Date()).getFullYear(), (new Date()).getMonth(), (new Date()).getDate() );
article.id = href;
article.url = href;
article.header = tags[i].innerText;
channel.articles.push( article );
gettitle = tags[i].innerText;
}
}
]]>
</parse_channel>
內文搜尋

X