October 15, 2009
在windows生产环境搭建sphinx的注意事项
"1、以服务的方式运行sphinx\n在开发环境中,只要执行”rake ultrasphinx:daemon:start“,就可以启动一台sphinx服务器。但如果在生产环境还能这么做么?把sphinx安装为服务无疑是个靠谱的办法,这样它可以像mongrel、apache一样随系统启动。sphinx自带了安装为windows服务的命令:\nsearchd –-install -–config xxxx.conf\n相应的删除服务命令为:\nsearchd –delete\n不妨把这个加入到rake命令中,于是我hack了一下ultrasphinx插件的任务列表,加入了一个”rake ultrasphinx:daemon:install“命令。名为ultrasphinx.rake的文件我将稍后提供。 如果在启用服务的时候提示”发生系统错误1067″的话,则需要在安装服务的时候指定配置文件的路径,参考:sphinx在windows下无法启动的解决办法 如: d:\\csft3.1\\bin\u0026gt;searchd –install –config d:\\csft3.1\\bin\\www.conf\n既然 …"
October 15, 2009
Sphinx增量索引实例
"在实际应用中往往有这么一种情况,数据库数据很大,比如我们的歌曲表,如果我们每次都去更新整个表的索引,对系统得开销将非常大,显然这是不合适,这时我 们会发现,每天我们需要更新的数据相比较而言较少,在这种情况下我们就需要使用“主索引+增量索引”的模式来实现实时更新的功能。\n这个模式实现的基本原理是设置两个数据源和两个索引,为那些基本不更新的数据建立主索引,而对于那些新增的数据建立增量索引。主索引的更新频率我们 可以设置的长一些(可以设置在每天的午夜进行更新),而增量索引的更新频率,我们可以将时间设置的很短(几分钟左右),这样在用户搜索的时候,我们可以同 时查询这两个索引的数据。\n下面,我们通过一个简单的例子来描述一下怎样实现这种模式\n以sphinx.conf中默认的数据为例:\n1.先在mysql中插入一个计数表和两个索引表\nCREATETABLEsph_counter( counter_idINTEGERPRIMARYKEYNOTNULL, max_doc_idINTEGERNOTNULL ); //主索引使用(确认之前是否已经建立过该表,如果已经建立,这里就不需要重新建了) …"
October 15, 2009
sphinx实现主索引+增量索引
"装了几次没把sphinx集成到mysql中去(SphinxSE),只好放弃,使用其自带的api(sphinx.php)来试试。 官方的sphinx0.98不支持索引GBK的数据,后装了Coreseek提供的版本,几经测试后,终于搞定GBK的数据索引。 然后调用sphinx.php写了个搜索测试程序,终于试出来,也蛮好用的。\n主要按照Coreseek整理的 Sphinx0.98中文参考手册 中的内容,这里记录一下。\n创建主索引:\nbin/indexer –config etc/sphinx.conf hx_9enjoy –rotate\n创建增量索引:\nbin/indexer –config etc/sphinx.conf delta –rotate\n合并主索引和增量索引:\nbin/indexer –config etc/sphinx.conf –merge hx_9enjoy delta –merge-dst-range deleted 0 0 –rotate\n–rotate参数可以在不停searchd的情况下索引,不然的话会有类似如下的提示: FATAL: failed to lock …"
October 15, 2009
FreeBSD中portsnap与csup,cvsup方法更新ports的不同
"从6.0开始,freebsd升级ports就不再需要cvsup了,而是用portsnap,\n一、portsnap与cvsup的区别在于\n:\n1、portsnap有数字签名,较安全,cvsup没有。\n2、portsnap是打包压缩下载,所以会比cvsup快一些,当然除了第一次使用。\n二、使用方法是:\n第一次使用:portsnap fetch extract\n以后再用:portsnap fetch update\n还可以放在cron里定时升级:portsnap cron update\n需要注意的是不要portsnap和cvsup混合使用。\n第一次使用输入portsnap fetch extract回车即可,因为有几十兆的文件需要下载,需要等待一段时间。\n如果用户没有安装ports,这个命令是无效的,需要通过sysinstall来安装ports\n修改更新服务器地址的方法:\n/etc/portsnap.conf 里面更改\nSERVERNAME=portsnap.hshh.org\n提供几个postsnap更新的服务器地址\nportsnap.hshh.org\nportsnap2.hshh.org …"
October 15, 2009
mysql中查询后记录集的排序问题
"在mysql上一般的查询要么是按一个字段的升序,要么按降序进行排序,如果实现根据条件里值的左右顺序来显示记录呢,如 where id in (3,1,5,2)此类的,查询出来的记录从上到下也是(3,1,5,2)这类的顺序了,可以用以下语句来实现:\nSELECT * FROM documents WHERE id IN (3,5,7) ORDER BY FIELD(id,3,5,7) "
October 15, 2009
Sphinx速成指南
"版权 ? 2008 Dony,,版权所有,转载请声明来源与作者\n2008-01-17\n目录\nSphinx简介 1.1. 什么是全文检索\n1.2. 介绍\n1.3. Sphinx的特性\nSphinx安装(For MySQL) 2.1. Windows下安装\n2.2. Linux下安装 3. 实例说明\nSphinx配置\n运行Sphinx\n搜索(翻译)\n6.1. 匹配模式\n6.2. 布尔查询语法(Boolean query syntax)\n6.3. 扩展查询语法(Extended query syntax)\n6.4. 权重(匹配度,Weight)\n如何调用Sphinx\nSphinxSE的SQL查询例子演练\n如何自动重建索引\n相关资源\n1. Sphinx简介\n1.1. 什么是全文检索\n全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。\n1.2. 介绍\nSphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实 …"
October 14, 2009
windows平台下gbk编码数据库的sphinx的设置
"sql_query_pre = SET NAMES GBK\ncharset_type = zh_cn.gbk #sbcs\ncharset_dictpath = D:\\csft3.1\\data"
October 14, 2009
Sphinx在Windows下安装使用[支持中文全文检索]
"前一阵子尝试使用 了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统。网上的资料大多是在linux环境下的安装 使用,当然,作为生产环境很有必要部署在*nix环境下,作为学习测试,还是windows环境比较方便些。\n本文旨在提供一种便捷的方式让Sphinx在windows下安装配置以支持中文全文检索,配置部分在linux下通用。\n一、关于Sphinx\nSphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。\n一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。\n当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。\n搜索API支持PHP、Python、Perl、Rudy和Java,并且也可 …"
October 14, 2009
sphinx+MySQL的安装使用(重新整理)
"一、MySQL+Sphinx+SphinxSE安装步骤: 1、安装python支持(以下针对CentOS系统,其他Linux系统请使用相应的方法安装) yum install -y python python-devel\n2、编译安装LibMMSeg(LibMMSeg是为Sphinx全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。LibMMSeg在本文中用来生成中文分词词库。)\n以下压缩包“sphinx-0.9.8-rc2-chinese.zip”中包含mmseg-0.7.3.tar.gz、sphinx-0.9.8-rc2.tar.gz以及中文分词补丁。\nwget http://www.coreseek.com/uploads/sources/csft3_0b2.tar.gz wget http://www.coreseek.com/uploads/sources/mmseg3_0b2.tar.gz unzip sphinx-0.9.8-rc2-chinese.zip tar zxvf …"
October 14, 2009
通过在UL标签应用相关的css类,实现对LI的控制
"aaaaaaaaaaaaaaaaaaaaa\nbbbbbbbbbbbbbbbbbb\naaaaaaaaaaaaaaaaaaaaa\nbbbbbbbbbbbbbbbbbb"