2008年2月27日 星期三

 

收集成语词库

今天在网上收集了三万多条成语,经过整理,一次性灌入核文器,目前系统已经可以识别15525条中文词汇了,这里是指固定词组,组合搭配词组则不可计算。

标签:


2008年2月25日 星期一

 

核文器提高文章字数限制

对程序进行了一些优化,提高了运算速度。
将校对文章字数上限提高到一万字,争取一万字校对也控制在一秒钟内。

标签:


2008年2月23日 星期六

 

“核文器”正式开通

全国首创在线文章校对工具“核文器”正式开通。网址:www.hewenqi.com
“核文器”这个名字是我夫人首先提出的,意思是核对文章的工具,这与“核武器”没有什么关系。
程序开发过程并不算长,主要的工作是词库整理,通过对海量词语的分析整理,建立了现在使用的基础词库。但是错误词库还很欠缺,需要广大网友积极参与。

标签: ,


2008年2月22日 星期五

 

网站日志分析

服务器刚刚建起来,可是日志每天都几百兆,分析了本月21号的日志,结果如下:
并且频繁查找一些不是本站的域名和不存在的文件。应该是本站的IP曾经被服务商用作虚拟主机,为至少为80个网站提供过服务。

明白了事情的原因,不知道是该哭还是该笑,服务器被频繁访问有些压力,但是有很多人错误的访问我的主页,算不算免费广告 ^_^

标签:


2008年2月19日 星期二

 

www.URLShow.com可以访问了

我的主站 http://www.URLShow.com 今天可以访问了,以前选择了好多方法,包括自己写些CMS都不是很理想。目前选择了MoinMoin作为内容发布系统,感觉还不错,目前在调整中。

标签:


 

iptables防火墙安装注意事项和常用命令

在服务器上设置了防火墙,设置过程中不小心在把自己也给防了。。。总结一下经验教训:
iptables常用命令:

标签: ,


 

讨厌的奇虎机器人

服务器才刚刚启用2天,就发现奇虎的bot不停访问,设置了robots.txt也完全没有作用。日志文件不停增长,只好设置iptables对奇虎的IP予以屏蔽。

标签:


2008年2月18日 星期一

 

清理博客,新应用重大突破

07年我在开发一套blog聚合系统,收集其他博客的信息发布到我的博客上。
开发过程很有意思,但最终结果根本没有实用价值。
昨天调整好了博客系统,今天把以前遗留下来的那些转载文章删除掉,然后发现我的博客只有寥寥数篇。

晚上有通宵达旦,升级新应用,新应用已经可以处理英文了,她到底是个什么功能的系统呢?我现在还不能公布,开发马上就要完毕了。已经到了最终测试、最终数据输入阶段了。新系统应该会采用新的域名。

标签: ,


2008年2月17日 星期日

 

urlshow终于有了自己的服务器

今天URLShow终于有了自己的服务器,折腾到凌晨Blog才能够使用。

标签:


订阅 帖子 [Atom]