前段时间作了个博客推广方面的网站:中文博客群(http://www.bokequn.cn),里边有个功能就是可以定时读取博客们的文章信息到数据库中,再显示出来供用户查询和处理tag.因为是虚拟主机,所以只想到了用服务器端的timer来解决。
当时比较匆忙没来得及优化,水平也很有限,如果大家觉得某些地方不对或者有更好的方式来解决,还请不吝赐教。
我觉得整个过程两个重点:
如何处理timer
将读取rss模块化,更方便调用
1.关于timer,当然是写在了global.asax中,首先建立变量:
system.timers.timer t=new system.timers.timer(1000*convert.toint16(system.configuration.configurationsettings.appsettings["do_time"]));
其中在web.config 中用do_time来存取多久执行一次
接下来在application_start中处理:
t.autoreset=true;
t.enabled=true;
if(common.func.get_key("can_do")=="1")//也是在web.config中存取是否进行定时处理,其中common.func.get_key是自定义的获取设置的函数
t.elapsed +=new system.timers.elapsedeventhandler(fun);
函数fun的代码:
private void fun(object sender, system.timers.elapsedeventargs e)
{
try
{
system.datetime dt=system.datetime.now;
common.func.write_log("开始读取远程xml");//写入日志
rss2sql rl=new rss2sql();
rl.readall();
system.datetime dt2=system.datetime.now;
common.func.write_log("xml文件导入到数据库成功"+convert.tostring(dt2-dt));//将本次执行时间写入日志,
}
catch(exception ex)
{
common.func.write_log("读取远程xml文件出现错误:"+ex.message);//写入日志
}
}
global.asax中代码完毕
2.接下来就是在rss2sql类中从数据库获取rss列表,根据上次读取rss时间和rss文件的修改时间来读取rss文件并写到数据库中,因为用到了太多自定义的类和方法,所以不列出所有的代码,有兴趣的朋友可以到最后下载,其中比较重要的函数:
/**//// <summary>
/// 读取指定链接的rss内容到数据库
/// </summary>
/// <param name="id">对应博客的id</param>
/// <param name="url">rss地址</param>
/// <param name="dt">上次读取时间</param>
public void read_from_url(string id,string url,system.datetime dt)
{
op_db.db_class db1=new op_db.db_class();
try
{
rssfeed feed = new rssfeed(url,dt);//建立一个rss读取类实例
feed.read();//开始读取
if(feed.channel.items.count>0)//如果文章数大于0,开始读取到数据库
{
for(int i=0;i<feed.channel.items.count;i++)
{
write_artical(id,feed.channel.items[i].title,feed.channel.items[i].link,feed.channel.items[i].description,feed.channel.items[i].pubdate);
}
db1.sql="update bokequn set last_rss_date='"+feed.lastmodified.tostring()+"' where id="+id;
db1.executesql();
}
}
catch(exception ex)
{
common.func.write_log(id+":url:"+url+"错误"+ex.message+ex.source+ex.stacktrace);
}
finally
{
db1.db_close();
}
}
其中rssfeed 就是自己写的处理rss的类,对于这个类,以前曾经用过一段时间开源的rss.net,但是实际过程中因为各种rss地址都有,甚至很多不太符合标准,所以会遇到很多问题,而且看了一下源代码,他想处理的东西太多了,代码量也非常庞大,我这点水平估计一时半会是改不好的,于是就自己作了个控件,也算不上控件了,就几个类,当然我处理的内容也相对简单了很多,只处理rss的标题和简介,item的标题,简介,时间,链接。
代码贴过来太多了,有兴趣的朋友可以到最后下载
用法相当简单了,把编译后的dll引用过来就可以如下使用:
rssfeed feed = new rssfeed(url,dt);//建立一个rss读取类实例
Java Asp PHP .Net XML C/C++ CGI VB Jsp J2ee J2se J2me EJB Servlet Tomcat Resin Struts Weblogic Eclipse ANT GUI JMS Web servise IDEA Webphere Hibernate Spring Jboss Applet Swing Socket Javamail Perl Ajax P2P 安全 模式 框架 测试 开源 游戏
Windows XP Windows 2000 Windows 2003 Windows Me Windows 9.x Linux UNIX 注册表 操作系统 服务器 应用服务器