首页 电脑学院 黑客教程 网站技术 网页特效 免费论文 公文写作 演讲发言 实用文档 职场指南 时尚生活 情感男女 其他资讯

您的位置:首页-> 网站技术-> .NET技术-> Marc数据格式和数据库格式的转化体会
Marc数据格式和数据库格式的转化体会
首先感谢CSDN上的djkhym(hym),给我的巨大的帮助,借鉴了他的程序的思路。



Marc(machine readable catalogue)数据,机读目录数据。Marc格式和数据库的转化,是图书系统里的重要部分,也是核心技术。现在网上mar数据的资料很少,和数据库的转换的资料就更少了。。。。。我主要参考了《中国机读目录格式使用手册》和hym的程序,为了以后大家少走弯路,所以我写了这个体会。(呵呵,现在网上转一条marc数据要2毛钱呢)

marc数据的基本格式,大家都可以在《中国机读目录格式使用手册》中详细的查询。这里我简单的说说。本Marc数据格式遵循GB/T 2901(ISO 2709)的标准,扩展名是.iso。如下是记录marc的iso文件中的一行,也就是一条marc数据。

00806nam0 2200229 450 001000900000010003500009092002000044100004100064101000800105102001500113105001800128106000600146200003100152210003300183215001500216330020500231333008500436606000500521690000800526701001500534801002700549?S7240011? ­a7-5034-1525-8­b精装­dCNY130.00? ­aCN­b01-724-0011? ­a20021211d2002 ekmy0chiy0121 ea? ­achi? ­aCN­b110000? ­ay z 000yy? ­ar?1 ­a邓小平理论辞典­f李长福主编? ­a北京­c中国文史出版社­d2004.7? ­a0720­d16开? ­a本书是一部力求全面、系统、准确反映邓小平理论科学体系和检索邓小平理论重要观点,供广大党员、干部及群众学习、研究、宣传邓小平理论的工具书。全书在反映、阐述邓小平理论的同时,还涵盖了马克思列宁主义、毛泽东? ­a思想和“三个代表”重要思想的核心内容,体现了科学社会主义理论一脉相承的发展脉络。? ­a? ­a­v4? 0­a李长福主编? ­aCN­bS7240011­c20040709?



记录结构:记录头标 、地址目次区 、数据字段区、记录结束符

00806nam0到450#是记录头标(#代表空格)

001000900000到801002700549@是地址目次区(@代表字段分隔符IS2)

S7240011到20040709@是数据字段区

%是记录结束符(%代表记录结束符IS3)

具体的每一个字节都有特殊的含义,大家可以看书,我这里讲讲自己转换的体会。

1. 字段长度的计算:0-4位是代表记录的总长度,注意包含了空格和分隔标志符。英文字符1位,中文字符2位。注意asp中len(“我”)结果是一位,故vb中这样写长度计算:LenB(StrConv(st1, vbFromUnicode)),再用format(str1,00000)来格式化输出。

2. 几个符号:

$:字字段标识符IS1

@代表字段分隔符IS2

%代表记录结束符IS3

这是人为的标记,便于学习和观看。在实际系统里一般用这几个字符代替:

$--------chr(31)

@--------chr(30)

%--------chr(29)

还有个空格很重要,每个字段间的空格都是严格规定的,所以学习的时候用#来代表空格。如头标:01071nam0#2200277###450#

3.地址目次区的理解:人为添加,和;的分隔,就很明显了。

001,0013,00000;005,0017,00013;…………………………801,0022,00771@

这里001,0013,00000;是表示数据字段区的第一个字段,字段号:001,长度:0013,开始的位置:00000。后边的类推,就是位置在加。

Dbtomarc的计算方法,先写数据字段区,再一个字段一个字段的算,可以开一个数组:Block(i, 3) , Block(i, 0)为标识,Block(i,1)列为宽度,Block(i, 3)列位置,I是指字段的个数。

Marctodb就是反过来了。。先读,在去截数据字段区。

地址目次区一定要算对,否则电脑可不认识,后边的数据就错位了。

4.数据字段区:

按字段一个个的写入(读出)就可以了。注意一点:

012001022343@20020928000000.0@##$a7-80142-191-4$dCNY46.00@…………………………………………@%

就是空格个数和分隔符号的使用,一定要注意,否则格式就错了,不能机读,这可是我的教训啊。。。。

5,将转换的数据库字段作成配置文件,可以选择的转换,便于程序的通用。

和编辑约定规则,如数据库记录中:书名[版次]、书名<丛书>这样获取版次,判断是否是丛书。还有是就编著者不超过3个……看你程序设计的通用性了。

6.拼音的实现,我是查的数组实现的,不知道有没其他的好办法。。。

7.再说一点就是,这种数据转化重要的是吃透格式的要求,其他的算法就是查询写入,看你的功底了。我喜欢利用数组,呵呵。。。



在百度中查找更多Marc数据格式和数据库格式的转化体会的内容
职场宝典   职场故事   职场跳槽   职场文化   职场理财   职场充电   情感天地   职场女性   职场礼仪   职场新人
报告总结   述职报告 工作总结 调查报告 工作汇报 计划方案 个人总结 社会实践 规章制度 调研报告 
  实习报告 考察报告 辞职报告 
演讲发言   竞职演说   就职演说   精彩演说   爱国演讲   英语演讲   十七大演讲   安全生产演讲稿   
节日祝福   重阳节 国庆节 教师节 中秋节 情人节 七夕节 劳动节 妇女节 清明节 愚人节 春节 元旦 圣诞节  儿童节  端午节 母亲节 新婚祝福 生日祝福 
讲话致辞   开业开幕   会议主持   庆典致辞   会议发言   党风廉政   党政报告   贺电慰问   婚丧嫁娶   思想宣传
法律常识   基本常识   法律文书   权益常识   劳动保障   婚姻继承   民事诉讼   刑事诉讼   
党建材料   入党申请   思想学习   党性分析   思想汇报   转正申请   民主生活   党委党建   入团申请   申报材料
求职简历   个人简历   求职自荐   求职谋略   面试技巧   求职英语   自我鉴定   英文简历   简历封面
心得体会   心得体会   经验交流   读后感   
时政热点   和谐社会   先进性教育   新农村建设   十七大   八荣八耻   科学发展观   劳动合同法   
人际沟通   社交技巧   社交礼仪   口才技巧   谈话技巧   演讲技巧   
营销技巧   电话销售   网络销售   推销技巧   促销技巧   销售口才   营销手段   销售技巧   谈判技巧   

“ Marc数据格式和数据库格式的转化体会”来源于网络,版权归作者所有!勿用于商业用途。

.NET技术

ASP技术
PHP技术
JSP技术
.NET技术
服务器技术
数据库开发
其它类

本类阅读TOP10

·数据库的连接串(中文)
·DES(Data Encryption Standard)加密解密整理
·利用Jmail发送和接收邮件(C#)
·.NET Framework 中多语言支持的实现
·动态菜单
·.NET 框架类库(上)
·C#中的事件
·微软.NET战略和ASP.NET简介(1)
·加密与解密
·ASP.NET中的代码分离

广告


关于本站|服务条款|广告服务|客服中心|发布文章|网站留言