SiteFactory1.0试用手记(第一阶段)

安装版本:SF 3.13更新版

1、安装过程挺顺利,不过据说从动易老程序迁移会发生一定的困难;
2、采集功能很强大,但是开始和结束标签不能太简单,否则会抓不到内容。IWMS的采集我从来没有成功过,风讯的对内容也挺挑,动易的嘴还不算叼。最重要的是可以自定义字段采集,不象其他系统固定采集字段。采集的东西不会无故更改内容。对比测试下,分页采集的功能比独立运行的“火车头”还完整可靠,的确有过人之处。
3、默认情况下文章和栏目都不生成静态,速度慢,压力大,生成之后速度快很多。对栏目设置静态生成等选项需要对栏目按右键,一般不看说明书的人不会想到网页中按右键才能设置属性。
4、FCK编辑器会更改标点符号为字符编码。
5、如果设置了分页标题就一定要选中手工分页,否则就没有分页效果。用标题式分页就必须将第一页标签放在最开始位置,否则设置两个分页,会生产出三页来,并且牛头不对马嘴。
6、采集生成速度与风讯ASP、IWMS差不多。采集的时候CPU经常99%。采集后的文章不可以默认审核通过,在管理中只有一页一页地审核。
这个问题动易有了官方解决方案:

问题:采集文章不会自动审核?
解决:在添加或修改采集项目时,在字段设置时,把状态字段的值设置为指定值:99就可以了。99就是代表终审通过的状态码。

7、如果是复制的采集规则,那么上次的采集地址还在,并不会清空。当新规则运行的时候会再来一次,并且地址是错误的。这个问题估计会得到修复。
8、如果嫌后台列表每页的文章数太少,不适合批量操作,可以把每页显示数调大。在动易后来,这个参数是可以随时调整的。这个设计不错。
9、删除文章后,其所附带的附件不会被同时删除,也没有清理机制。

动易SiteFactory与风讯dotNetCMS的初印象

这两家公司在CMS的asp阵营中可以说是两个大脑袋(巨头)。以前因为动易安装是要注册组件的,而风讯是开放源码,所以着重了解了下风讯。因为研究出了将免费版升为SQL版的方法,所以将风讯并且实际应用了两个站,虽然感觉有些问题有待完善,但是总体感觉还是不错的,特别是ASP代码修改起来相对容易,风讯将样式和标签分开的做法比较适合我的思维方式。

不过,ASP毕竟是老了,现在这两家都推出了自己的asp.net产品。动易的叫SiteFactory(简称SF),风讯的叫dotNetCMS(权且叫DNC)。DNC在RC1、RC2版本出来后试用了一下,只是为了感受一下后台的氛围,结果比较失望,没有什么让人兴奋的地方。ASP版本的一些问题,比如编辑器依然存在问题,一些基本的东西还是没有改变,似乎是用c#语言重写的ASP版本。从动易和风讯的论坛来看,动易明显在这次升级中占上风。因为C#比ASP复杂得多,熟悉asp.net环境的学习过程也相对困难,所以我认为风讯即使在未来的一周之内开放源码,愿意了解它的人也不会很多,除非……用了他的ASP版本,没有什么其他的升级选择。

了解动易SF是从说明书开始的。说明书写得很专业,计算机专业书通行的通行风格。相比之下风讯的就差远了,一个没有什么清晰条例的WORD文档而已。还有一个显著的变化就是两家公司的网站差距也越来越明显,动易此次改版一去往日的陈旧感觉,而风讯就好像要倒闭一样没有任何变化,及时是网站的消息、教程也都大半年没有更新了。

两个程序的发布也比较有趣,虽然记得不是很清楚,但是给我的印象就是动易是追上来的。动易先是开放ASP源码,请安全组织测试自己的安全性,风讯为了应对就放出了自己ASP往期产品的SQL版。然后动易率先开放测试NET版本,风讯在压力之下也赶紧发布测试。3月6日动易发布正式版,12日风讯也赶紧发出正式版,也许是底气不足,免费版本还要推后到22日。表面上看似乎是为了商业利益考虑,不过我认为这是没有底气的表现,也许他需要时间添加一些激动人心的东西,以挽回慢一步的尴尬。

从已经获得的信息看,两个.NET系统的都不默认支持ACCESS。确实,功能这么强劲条件下很难有闲情做到同时兼容两种数据库。风讯不知道最后会如何。

动易SF中更改栏目概念为节点,建立模型概念。其实这种概念重组很象当初风讯将标签和样式拆分的做法,突破了以前CMS的弊端。而从风讯目前资料看,在这个问题上没有突破。

动易SF模型可以让用户自建数据表,自定义字段。这很激动人心,特别是对数据库编程不在行的设计人员。难能可贵的是才采集功能中也能逐字段按自定义模型采集,这解决了风讯一直困扰我的问题。而且采集可以后台执行,不用担心ASP下的意外中断。编译执行的程序和脚本确实不同。

动易的标签设计肯定是受了风讯自由标签的启发,虽然我还没有亲自实践,但是从介绍看,只要掌握了这种标签建立方法,会比现有的风讯自由标签更灵活。

动易的标签建立是我最疑惑的部分。ASP版本下我很难入门,这次的SF说明书也没有很直观的解释标签系统,我比较担心它没有风讯的样式加标签形式直观易懂。不过如果仅仅是这么一个问题的话倒是可以接受,毕竟好用和易懂之间总是要找个平衡点的。

动易详尽的制作精美的使用说明,改版后的网站,论坛的超高人气,让人觉得可靠。风讯每次发布新程序都喜欢拖在最后时刻,宣布发布测试版、正式版也感觉是在动易的紧逼下匆忙进行,让人对其稳定性心怀猜测。

【年终清扫】风讯4.0的权限设置心得

(该文创建于9月4日,成稿于9月20日,放在桌面上一直没有发布)

系统默认产生的超级管理员,不受任何限制,无论怎么设定权限。而其他管理员即使被赋予权力也无权新增管理员。如此看来“父级管理员”这个概念似乎没有必要。也许在风讯的其他商业版本中会有用处。

赋予一个管理员权力可以“自定义管理员”,任意设置权限。也可以设置好几种权限套餐,以便日后根据工作性质快速分配权限,这就是“定义固定管理员权限”。系统刚安装完成的时候,全都没有设置,一切从没有开始。作为长期运行的网站,最好是预先定义好管理员类型,以便日后快速分配。需要注意的是,管理员类型只是在赋予权限的时候有作用,并不会自动同步。比如赋予A“总编辑”权限,然后“总编辑”权限发生了变化,就需要再赋予A一次“总编辑”权限,否则A的权限不会因为其他设定的更改发生变化。

在赋予权限时,有时候需要同时勾选栏目名称和权力内容。其实这两者的匹配并不是很严谨:如果勾选了权利内容,勾不勾选栏目名称结果都一样;如果只勾选栏目名称不给任何权力,那该用户登录后就只能看到这个名称而不会拥有全力。有时候没有勾选的栏目,比如我遇到的“专题”不勾选也会自己出来,也许是其他的权力牵引出了这个栏目的部分权力吧。

需要注意的是:慎用“管理员管理”权限。有了这个权限任何用户都可以自助把自己的权限提到最高;在涉及到栏目的选择中,必须勾选栏目名称,否则就视为没有勾选该功能;新增加栏目后,无论谁新增的栏目,设定的管理员是谁,都必须专门赋予权限,否则无权对该栏目进行添加新闻等操作。

另外,新闻管理里至少要有一条新闻,否则有一排管理项目会隐藏不显示。比如“批量替换”。有些新手如果不往里填新闻,一辈子也试不出这个按钮来。

修正“清除浮动”后产生的双倍下边距

为了让FF能撑开父容器,所以加入了一个清除浮动层,谁知道FF的问题解决了,IE却出了个双倍底边距的问题,上边空50,下面就会空100。试了常见问题中的“双倍边距”解决方法,没有作用。如果取消这个清除浮动层,问题消失,所以基本确定症结是浮动产生的混乱。

<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN” “http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd“>
<html xmlns=”http://www.w3.org/1999/xhtml“>
<head>
<meta http-equiv=”Content-Type” content=”text/html; charset=gb2312″ />
<title>无标题文档</title>
<style type=”text/css”>
<!–
* {margin: 0px;padding: 0px;border: 0px;}
body {background-color: #480001;}
.book_list {padding: 100px; width: 720px;margin: 0 auto;background-color: #FF9900;overflow: hidden;}
.book_list_li {float: left;height: 170px;width: 330px;background-color: #990000;}
–>
</style>
</head>
<body>
<div>
<div><ul>
<li></li>
<li></li>
</ul></div>
<div style=”clear:both;”></div>
</div>
</body>
</html>

试了很多方法不行,无意给没有属性的DIV加上边框后问题消失,意识到可能是IE的haslayout问题。于是让“<div><ul>”中的DIV获得layout,设置属性,且高为1%就可以让他得到layout。显示正常。

火车头经验总结

071204:【3.2】遇到年月日的中文字,可以替换年月为-号,日字取消的办法恢复成标准日期写法;如果要分批处理,可以采集地址后,将下批地址筛选出来,设置成-1已经采集,不退出,待第一批采集后批量换会0,开始采集。这种方法可以做到小修改规则。

071105:门户网站的页面内容通常分类都不是很清晰,经常是一个物理页面信息出现在好几个逻辑列表里,导致写规则很难,一个任务里经常有很多没有匹配内容的“空信息地址”。这些地址被占着不释放,而其他可能与之匹配的新任务却得不到网址。所以建议火车头增加一个清理的按钮。按钮规则就是,将所有未采集的信息删除,并且在总站地址库中也删除相同的URL,让其他任务可以得到这个地址而不被过滤。这样就不会出现很多占茅坑不拉屎的URL地址了。在没有这个功能前,可以新建一个新规则,然后用分离后未完成的数据库替换掉规则的默认数据库,直接采集内容。

071106:不知道火车头有什么算法上的问题,对URL地址总是不能尽收。是一次性数量太多了?分拆的结果也一样,而且找不到任何联系,同样的地址单独提交又可以……唉,直接改MDB数据库。把页面的地址单独采集成绝对地址的URL,用“追加粘帖”的方法插入任务中,然后直接采集。这么做地址的问题是解决了,但是重复的问题又来了,目前的程序架构下似乎无法避免。想起来好笑,本来就是“窃”,却要“窃”得专业些。看来秉性难移啊。

071107:教训是深刻的。我以为是火车头丢地址,却没想到是来源站——新浪地址重复出现情况严重导致了“丢地址”的现象发生。另外修改了几个规则。至于无效URL占用的问题初步考虑手工添加站点地址库的方式解决。

风讯的经验记录1

风讯的栏目图片竟然不可以在栏目模板调用,这个太不合理了。

“栏目描述”标签似乎没什么太大用处,干脆就拿他顶替栏目图片。

得出一个经验,在栏目设置完成后,最好生成一个站点地图页面保存起来。因为设计中肯定有许多调用,到时候可以在站点地图中直接找到静态页面的链接路径。

采集中如果出现ODBC错误,很有可能是采集的URL地址过长,特别是中文名字的页面,字符编码后超级长,长到程序员估计不足的地步。

071204:生成栏目页总是出错,头天还好好的。试着调试可能出错的标签无效。后逐一生成栏目页,到“心理”时发现错误,因为目录地址设置成了未知。按理不应该出这个问题,看来风讯的脚本也不是不可能出错。经验一:在生成全部目录的按钮按下后,其排列生成顺序是乱的,无法按序号判断是哪个栏目出错;经验二:碰到生成问题只有逐栏目排查。