“风讯4.05”实战第九天:开始模板之旅

系统和内容大约地搞定,进入最重要的表面工夫:模板。目前来说完全照标准还有难度,所以采取以标准为目标,先期杂和TABLE的方式,以最快速度上线。

风讯405提供的整合模板版本非常垃圾,甚至新闻列表的每一行都是一个TABLE,不知道是不是因为他的在线编辑器的原因,造成样式无法单独使用TR标签。感觉风讯的编辑器对于标准执行非常严格,而且智能化程度太高。比如段落开始的地方如果有半角空格就会被自动清除,而全角空格则不然。

风讯在发布的时候会在文件中加入一个JS调用标签和一个注释。JS是一个注明的JS类,对于重新制作模板的用户来说,这个前台的类应该用不着,需要去除。注释里有风讯的版权标志,也可以清除,避免“君子”太容易识别出网站所用的CMS系统。如果要清除的话,整站中有两个文件需要修改:

1、\Admin\PublicSite\Public_Function.asp 的最后一段。
2、\FS_InterFace\MF_LoadLabel.asp 的最后一段。

将其中引号包含起来的值换成空格。

《大话股神》港式烂片重装上阵 ☆

还记得九十年代初的所谓港产喜剧片吗?陈百祥、黄百鸣、曾志伟的时代,大多是些泡妞啊、发财啊之类的故事,所谓的搞笑也多是挠痒痒肉式的恶作剧,根本就谈不上幽默。虽然不怎么D,但是那时候只要有录像带,有放像机,就有人乐呵呵的看。现在似乎这种片子不多了。如果你还想找回当年的感觉,如果你需要一个“美女”来衬托秋香姐,恭喜你,现在你可以选择《大话股神》
不要看那海报上的所谓“股海秘笈”的宣传,不要因为大嘴、秀才、无双的出演,因为那只会让你失望乘以2、3、4……。就当他是一部普通的影片好了。整部影片可以看成是一个还不会走路的导演的涂鸦之作,里面满是对喜剧先贤的崇拜。比如豆子先生的长裤,金凯瑞提着公文包去抢工作,国产凌凌漆中星爷情调猪肉男的造型,功夫中秀逗男的刷牙造型,再加上支离破碎,过于浅显易懂而又非常没有逻辑的情节设计,终于锻造出这么一部让人看完之后脑门上要贴个“悔”字的电影力作。

说“力作”并不亏心。这次的演员阵容真的是满豪华,罗家英、成奎安、李琦、周海媚,以及人气正旺的《武林外传》三人组,我真不知道这导演李欣是什么来头了。或者该片的片酬很高?不会吧!如果剧组很有钱,怎么会用电视摄像机这种玩票的设备拍片呢?

DVDRIP小组大概担心做这部片子会砸了自己的牌子,所以都没有D版出来。倒是某PSP机友好心压了个PMP版本出来。第一次在PSP上看片,就看到了这部比冯主席的《别把自己不当干部》还低一个规格的“喜剧片”,实在是有一种失恋的感觉在心头。

后记:查了下导演李欣的资料,《自娱自乐》也是他拍的……。我觉得那片子虽然有点嫩豆腐的感觉,但是几个模仿还是不错的,效果和演员都还可以。没想到越拍越烂了,枉费在这条路上混了十来年。看报道说,尊龙就直接指责李欣的自以为是毁了《自娱自乐》。

李欣
李欣作品年表:
1995:《谈情说爱》
获奖记录:1996年第4届北京大学生电影节“艺术创新特别奖”,
1997:《我血我情》
2001:《花眼》
2003:《欲望边缘》
2004:《自娱自乐》
2006:《3温暖》(李欣、毛小睿、吴天戈每人执导一段)
  李欣,1969年生于上海,1991年毕业于北京电影学院导演系,毕业后分配到上海电影制片厂工作。从电影学院毕业后,他一直陆陆续续地写过几个剧本,几年来他一直在从事商业广告片的拍摄。
《谈情说爱》片中他大胆运用了三段式的结构,三个关于“爱”和“情”的故事,各自独立成章,同时又以人物的“巧合”将三个部分相互关联,达成统一。《谈情说爱》中某些类似广告的充满质感的画面以及场景、服装、道具富有超脱感的色彩,都是他匠心营造的一种“梦幻”,这些与真实有一定距离的东西,正是现实的镇痛剂,他希望用它们来呼唤真情。
《花眼》通过描述一位男子在公园中等待女友时想像的几段浪漫而又夸张的爱情故事,试图引发人们对都市爱情的思考。影片富有哲理性的语言、光怪陆离的音乐很新奇,整部片子给人的感觉像是一部MTV。
《3温暖》由李欣、毛小睿、吴天戈每人执导一段,组合成一部反映上海市民世俗生活的影片《3温暖》,这也是上影集团“新现实主义上海电影系列”开拍的首部作品。


·片名:大话股神
·导演:李欣
·主演:喻恩泰 李琦 成奎安 倪虹洁 田启文等
·上映日期:2007年8月21日
·监制:潘一尘 史东明 王健
·出品人:潘峰 张庙林
·制片人:赵琦

“风讯4.05”实战第七、八天:采集进行中。

风讯的在线发布功能无法成功,大概跟他基于线程的登录方式有关。也是,基于COOKIES是多么的不安全啊。

于是采取折中方案。将数据采集不入库,生成自定义的HTML文件,然后该名字并存放在一个临时设立的站点中,然后用风讯自带的采集器采集。问题在于风讯的系统不支持自定义字段,包括“关键词”。好在内容中还原了IMG文件的地址,所以远程存图还是没有问题的。

需要注意的几个问题。

0、风讯采集的标签过滤存在重大问题,所以不要用它的标签过滤功能,否则会造成标签残缺。
1、采集集生成的是绝对地址。正文中的可以采取内容“批量替换”的方式解决,但是缩略图中的地址则要修改数据库;
2、删除文件后,采集来的图片文件不会自动删除。手工添加的新闻图片也不会自动删除,失败次数多的话,垃圾文件将会很多;
3、重复采集的话,一定要在“新闻处理”中删除历史记录,否则视为重复采集被过滤掉.“删除全部已入库新闻”其实就是清空历史记录。这个短语有严重误导。
5、自动远程存的图在Remoteupfile目录下,而采集的则在手工上传的文件夹中。采集的可任意指定目录。
6、采集的时间只要是符合一般格式都可以,不必要是完整日期时间。但是时间字段不能存其他类型的文字。
入库操作的问题:
1、“全部入库”会将历史记录中全部的信息再次入库,非常容易产生重复信息。切忌使用。
2、采集完成后尽快入库。并立即清除所有入库条目(此处的库是指采集库)
3、信息所入库的栏目是根据采集规则定,所以在正式入库以前,原采集规则不可更改。
由于风讯采集没有“关键字”项目,所以用“来源”字段采集,然后用SQL命令转移到关键字字段。所用命令如下:

FS_NS_News表中”ClassID”字段内容非DE5FDE9JJ69DIFF、FDEA0A2GJ2I0I21的所有记录:
将”Source”字段的内容复制到”Keywords”字段,然后”Source”清空为<null>
GK给出的命令如下:
Up&#100;ate FS_NS_News Set Keywords = Source Wh&#101;re ClassID Not IN (&#39;DE5FDE9JJ69DIFF&#39;,&#39;FDEA0A2GJ2I0I21&#39;)
Up&#100;ate FS_NS_News Set Source = &#39;&#39; Wh&#101;re ClassID Not IN (&#39;DE5FDE9JJ69DIFF&#39;,&#39;FDEA0A2GJ2I0I21&#39;)
注意,此语句赋空值,如果不写任何东西可能就是<null>

“风讯4.05”实战第六天:试用火车头采集器

1、“正文”中过滤链接,因为多数站带有站内导航。

2、要获得正文中真实的绝对地址,只有手工替换src=为src=http://www.……,采集器自带的分析“真实地址,不下载文件”无效。

3、HTML模板必须要重新选择,必须要是绝对地址,否则不生成。

4、特别要注意的是在WEB发布中的根目录地址的设置,一定要是不带任何目录的,否则与设置文件中的相对地址产生冲突,造成无法使用的故障。

“风讯4.05”实战第五天:修改分页设置

发现风讯在发布信息中会自动将内容按3000字分页,找了半天也不知道在哪里设置关闭。经过论坛咨询才发现,系统参数中的配置文件中有分页字数设置,设置改为0就不分页。

开设栏目的工作量比想像中艰巨。工作经验是:无论建立什么栏目都不要做成“外联”,待全部建立后,再修改成外联。否则将会一脑子浆糊。

前天做了第一次SQL备份,比想像中简单,对着项目右键看看“所有任务”就知道怎么做了。因为体积不大,都是做的“完全备份”。

“风讯4.05”实战第四天:试用采集

第一天用风讯405的时候搞错了,SK和风讯自带的采集并不是取代关系,这个SK采集是好事者加进来的,只有论坛下载版本才有这个SK采集,网站公开的下载中是没有的。

SK采集默认的是ACCESS版本,对应SQL需要做一些修改。位置在Admin\SK_cj\Incconn.asp,把数据库标志改为SQL的,输入用户名、密码、库名。因为有针对性设计,所以应该没有问题。

风讯自带的采集我觉得挺不错的,不知道为什么不满的声音会那么大。选择目标栏目的时候,风讯采集保持了顺序,而SK采集则是按照栏目ID数字排序。

风讯采集一个不人性化的地方就是在选择过滤标签时,把选择框放在了标签名的后面,而习惯上是放在前面。我因此迷惑了一下。

试用了一个比较复杂的翻页内容和过滤后,整个系统似乎停止响应,最后按“取消”等了半天发现才采集了两个新闻,而且还是不翻页的。看来本地运行的单机版采集还是有无可替代的优势。看看SK采集通一页如何。

SK采集的问题:

采集的时候没有副标题设置,自动输入“副标题”;简介也默认输入一截;自动输入翻页标记[NEXT PAGE];下载远程图片有问题。

http://www.lrwoman.com/html/jbzt/fkyz/gjjb2/gjjbjbzs/150927667.htm 这个地址的图片可以存在正确的目录下,但是文章中的链接变成了http://http://www.lrwoman……的形式,也就是加上了域名和重复的协议地址;改了配置文件,可以用于SQL版了,但是“历史记录”中的不会记录栏目名称和频道名称。是一笔糊涂账。

采集中还要注意:

多列表页采集,如果选手动,那么默认页的地址也要放在输入框中,不能省略。

采集规则中要求输入的地址名称是相对于总设置的目录,不要使用根目录符号否则会产生错误路径。

用来用去两个都不满意。风讯自带的采集甚至连过滤字符都没有,“替换”关键字的机制设计似乎存在缺陷。但是在不分页的情况下似乎比较正常,用于搬动老站的原创新闻比较好。

看来,还是要考虑单机版采集软件,或者直接将采集的数据往数据库中导入。