文献联合编目系统
文献联合编目系统建立在计算机网络应用技术的基础上,通过Z39.50服务器和客户端软件实现各成员馆间书目数据的实时传输和联合编目,逐步建立具有一定规模的联合书目数据库和联合馆藏目录,供各成员馆共享书目成果与文献资源,从而在网络图书馆内部及其外部的广大区域中形成统一而畅通的网络编目平台,提高其文献编目的整体效率与水平。该系统克服了传统方式下各个图书馆分散编目所产生的重复劳动、效率低下的弊端,实现了文献信息资源和人力资源的共享。
目前,我们已经开发完成了目前国内一流的Z39.50服务系统,并投入使用。该系统除了具有常规的Z39.50服务以外,还具有极大的系统灵活性,支持多种MARC数据格式,支持用户灵活权限系统,自动识别Unicode和ANSI编码的MARC记录,远程系统管理等,此外该系统除了自己独有的数据库体系以外,还支持MARC数据库结构自定义技术,能够灵活应对各种形式的数据结构,即允许用户使用自己的MARC数据库向外部提供Z39.50数据下载服务。
软件功能及特点
- 常规Z39.50客户端下载支持
- a. 匿名下载
匿名下载支持两种模式:① 默认匿名下载,支持查询和简单格式MARC数据的下载;② 全开放式匿名下载,即免费Z39.50数据下载支持,允许下载完整MARC数据。另外,匿名支持“公共用户”方式,即用户名和密码公开,而功能与匿名类似。
b. 标准权限下载
通过预先设定的用户名称和密码登录后下载数据,避免非法用户下载。
- 多MARC规格下载支持
- 允许用户自定义多种MARC规格(包含或不包含哪些MARC字段/子字段),数据库中放置简要MARC和完整MARC,但针对不同用户/用户组可提供不同完整程度的MARC数据。(直接原因是收费标准不同。提供简要MARC的目的是减轻Server的数据转换压力)
- MARC来源支持
- 在同一个数据库或多个数据库中定义多种来源的MARC数据,并且不同来源的的数据上载和下载计费标准会不同。同时支持多个库中检索、下载、上载。
- 用户管理
- 允许定义多种级别的用户和用户组,他们的权限不同,不同级别用户下载或上载不同规格/来源的费用不同,用户限定包括:
(a) 有效期限制;
(b) 不同日期或不同时间段可用性不同。高级别用户可以随时检索/下载,而低级别用户在非繁忙日期/时间段才能允许大数据量的查询和下载。
(c) 每天或每时间段查询/下载数据条数限制;
(d) 额定时间段查询/下载频率限制;
(e) IP限定;
(f) 单用户账号连接数限制;
(g) 密码有效期限定;
(h) 上载数据优先级;
(i) 丰富的用户信息,名称,地址,联系方式,联系人等信息。
- 上载数据审核
- 一方面提供全自动上载审核功能(通过针对不同会员单位设置优先级等参数),另一方面提供人工审核(允许或不允许修改)功能,确保数据质量。
- 通用检索点
- 允许定义非标准数据库结构提供Z39.50服务。用户指定表及其检索点字段、MARC字段、MARC格式、来源字段、数据类型、文献类型等信息。检索点字段可以与MARC不在同一个表中,使Z39.50通用性大幅度提高。
- Unicode支持
- 全面支持Unicode,系统可以自动识别ANSI字符和Unicode字符。
- 远程维护
- 系统管理层使用三层架构,基于Web2.0标准,以Web方式对服务器进行管理。包括用户管理、启动与停止、参数设置、计费结算等等。
- 用户端远程功能
- 用户可以查询通过Web页面了解自己的下载/上载信息、费用情况、用户权限、计费方式、修改密码、修改联系方式。
- 费用管理(欠费)
- 上载、下载计费管理。当费用用完或超支到一定额度(金额或条数)时,自动暂停下载功能,如果支持匿名方式,则允许进行数据检索。
- 多数据库类型支持
- Z39.50 Server能够支持Oracle和SQL Server两种大型数据库,并为不同的数据库进行专门优化。
- 高兼容性:多数据格式类型支持
- Z39.50 Server能够根据Z39.50 Client的请求,返回不同类型的数据格式,如标准MARC、UTF-8格式的MARC、XML格式数据等。
- 高兼容性:多类型Client支持
- 除了支持本公司的Z39.50Client以外,还支持大多数的其他类型Z39.50 Client端对本服务器的访问,如CALIS的Z39.50客户端。
性能指标
- 硬件环境:
- 服务器:Intel Xeon 5355 2.66G×1,4核心,4GB内存,RAID6阵列
客户机:Intel Pentium E2160,1GB内存
数据库:Microsoft SQL Server 2005企业版
网 络:100M LAN
数据量:书目数据160万种
- 设计性能指标:
- 单关键字快速检索
序号 |
命中记录数 |
响应时间(第一次) |
响应时间(第二次) |
1 |
≤10条 |
< 1.0秒 |
< 0.5秒 |
2 |
≤100条 |
< 2.5秒 |
< 1.0秒 |
3 |
≤1000条 |
< 4.5秒 |
< 1.5秒 |
双关键字组合检索
序号 |
命中记录数 |
响应时间(第一次) |
响应时间(第二次) |
4 |
≤10条 |
< 2.5秒 |
< 1.5秒 |
5 |
≤100条 |
< 4.0秒 |
< 2.0秒 |
6 |
≤1000条 |
< 6.0秒 |
< 3.0秒 |
- 系统支持容量:
- 标准容量:500万种
最大容量:1000万种
远程终端并发检索标准数量:50/秒
远程终端并发检索最大数量:200/秒
语言文字支持:>80种
每个检索关键字容量:1000万个
检索关键字容量:不限
每次检索可同时使用关键字:10个
数据库容量最大值:1TB(理论值)
同时连接最大值:1000
注:系统性能与服务的机器硬件性能、数据库服务器性能及与互联网连接的带宽密切相关。
|