一、什么是phpdig? phpdig是国外非常流行的垂直搜索引擎产品(与其说是产品,不如说是一项区别于传统搜索引擎的搜索技术),采用php语言编写,利用了php程序运行的高效性,极大地提高了搜索反应速度,它可以像google或者baidu以及其它搜索引擎一样搜索互联网,搜索内容除了普通的网页外还包括txt, doc, xls, pdf等各式的文件,具有强大的内容搜索和文件解析功能。phpdig同传统的搜索引擎一样,包含了以下三种最基本的技术: 1.spider技术 2.网页结构化信息抽取技术或元数据采集技术 3.分词、索引技术 区别于传统搜索引擎,phpdig适用于专业化更强、层次更深的个性化搜索引擎,利用它打造针对某一领域的垂直搜索引擎是最好的选择。 二、如何获得这phpdig? phpdig是免费产品(需要保留版权),最新版本是 phpdig-1.8.9 为了避免a...
美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入web服务。雅虎公司在www.developer.yahoo.com网站建立了yahoo search developer network,公司计划在此纽约举行的搜索引擎战略大会(search engine strategies conference)上推出这一计划。该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像、视频、新闻以及地区搜索等内容。想要使用这项服务的会员必须先去http://api.search.yahoo.com/webservices/register_application 申请一个自已的id号,注:每个id号每天只能搜索5000次。 下面我们看一下,如何用php脚本调用yahoo! search api实现搜索的效果,全部脚本如下: <?php// yahoo web s...
版权声明:任何获得matrix授权的网站,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明作者:andrew thompson;xmatrix(他的blog:http://blog.matrix.org.cn/page/xmatrix)原文地址:http://www.javaworld.com/javaworld/jw-10-2005/jw-1017-ajax.html中文地址:http://www.matrix.org.cn/resource/article/44/44116_ajax.html关键词: ajaxajax开发者的最新工具和技术基于xml的异步javascript,简称ajax,是当前web创新(称为web2.0)中的一个王冠。感谢组成ajax的各种技术,web应用的交互如flickr, backpack和google在这方面已经有质的飞跃。这个术语源自描述从基于...
利用搜索引擎技术进行对象持久化利用表面上无关的技术来帮助解决一些典型问题作者:mikhail garber译者:sunjune版权声明:任何获得matrix授权的网站,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明作者:mikhail garber;sunjune原文地址:http://www.javaworld.com/javaworld/jw-01-2005/jw-0103-search.html中文地址:http://www.matrix.org.cn/resource/article/43/43920_search_lucene_persitent.html关键词: search,lucene,persitent摘要:在这篇文章中,mikhail garber 专注于利用一种新的手法来解决一个旧的问题,那就是如何对基本的javabeans进行持久化。他向你展现了一种不需...
【简 介】 在经过一段时间的存储过程开发之后,写下了一些开发时候的小结和经验与大家共享,希望对大家有益,主要是针对sybase和sql server数据库,但其它数据库应该有一些共性。一、适合读者对象:数据库开发程序员,数据库的数据量很多,涉及到对sp(存储过程)的优化的项目开发人员,对数据库有浓厚兴趣的人。 二、介绍:在数据库的开发过程中,经常会遇到复杂的业务逻辑和对数据库的操作,这个时候就会用sp来封装数据库操作。如果项目的sp较多,书写又没有一定的规范,将会影响以后的系统维护困难和大sp逻辑的难以理解,另外如果数据库的数据量大或者项目对sp的性能要求很,就会遇到优化的问题,否则速度有可能很慢,经过亲身经验,一个经过优化过的sp要比一个性能差的sp的效率甚至高几百倍。 三、内容: 1、开发人员如果用到其他库的table或view,务必在当前库中建立view来实现跨库操...
面向 java 开发人员的 ajax: ajax 的 java 对象序列化在 ajax 应用程序中序列化数据的五种途径philip mccarthy , 软件开发顾问, 独立顾问2005 年 10 月 24 日如果您正在使用异步 javascript 和 xml(ajax)进行 java? web 开发,那么您最关心的问题可能就是把数据从服务器传递给客户机。在 面向 java 开发人员的 ajax 系列的第二篇文章中,philip mccarthy 介绍了 java 对象序列化的五种方式,并提供了选择最适合应用程序的数据格式和技术所需要的全部信息。在这个系列的 第一篇文章 中,我介绍了 ajax 的构造块:如何用 javascript xmlhttprequest 对象从 web 页面向服务器发送异步请求。如何用 java servlet 处理和响应请求(向客户机返回 xml 文档)。如何...
欢迎转载, 请保留出处:http://www.matrix.org.cn/blog/chrissearch engine friendlysearch engine friendly.是很多人挂在嘴上的一句话.至于搜索引擎是不是真的和你那么friend呢?如何评估你的站点对搜索引擎有多friend呢?太多的人使用spam来增加自己google的排名或者索引量.以至于更多的人以为, 只要我让更多的地方连接我, 我就可以增高访问量.可恶的spam..实际上,我们需要的是, 良好的内容, 良好的站点设计,良好的面向搜索引擎的优化.让搜索引擎, 比如google, 更容易索引你的页面, 让用户, 更容易通过google找到你的站点.这才是我们期望的. 既给网站带来访问量,又给用户带来价值,也给搜索引擎带来流量.为什么要搜索引擎友好?这是个巫启贤的歌迷爱问的问题.因为他有首歌叫"太??&q...
随着internet的日益普及,现在基于b/s结构的大型应用越来越多,可如何对这些应用进行测试成为日益迫切的问题。有许多测试人员来信问我b/s的测试如何做,由于工作较繁忙,对大家提出的问题也是头痛医头脚痛医脚,没有对web的测试过程做一个整体的概述。希望通过本篇能够让大家了解大型web应用是如何来进行测试的。 b/s下的功能测试比较简单,关键是如何做好性能测试。目前大多数的测试人员认为只要跑一些测试工具证明我的产品是可以达到性能的就ok了,为了证明而去测试是没有任何价值的,关键是要发现产品性能上的缺陷,定位问题,解决问题,这才是测试要做的。 首先我们从两个方面分析如何进行web测试,从技术实现上来讲一般的b/s结构,无论是.net还是j2ee,都是多层构架,有界面层,业务逻辑层,数据层。而从测试的流程上来说,首先是发现问题,分析问题,定位问题,再由开发人员解决问题。那么b/s的结构的测试如...
<p><strong> matrix...
本文定义了lucene(版本1.3)用到的索引文件的格式。jakarta lucene是用java写成的,同时有很多团体正在默默的用其他的程序语言来改写它。如果这些新的版本想和jakarta lucene兼容,就需要一个与具体语言无关的lucene索引文件格式。本文正是试图提供一个完整的与语言无关的jakarta lucene 1.3索引文件格式的规格定义。随着lucene不断发展,本文也应该更新。不同语言写成的lucene实现版本应当尽力遵守文件格式,也必须产生本文的新版本。本文同时提供兼容性批注,描述文件格式上与前一版本不同的地方。 定义 lucene中最基础的概念是索引(index),文档(document),域(field)和项(term)。索引包含了一个文档的序列。· 文档是一些域的序列。· 域是一些项的序列。· 项就是一个字串。存在于不...
Java Asp PHP .Net XML C/C++ CGI VB Jsp J2ee J2se J2me EJB Servlet Tomcat Resin Struts Weblogic Eclipse ANT GUI JMS Web servise IDEA Webphere Hibernate Spring Jboss Applet Swing Socket Javamail Perl Ajax P2P 安全 模式 框架 测试 开源 游戏
Windows XP Windows 2000 Windows 2003 Windows Me Windows 9.x Linux UNIX 注册表 操作系统 服务器 应用服务器