2.1 信息的三种世界及描述
信息的三种世界是指现实世界、信息世界和计算机世界(也称数据世界)。数据库是模拟现实世界中某些事务活动的信息集合,数据库中所存储的数据来源于现实世界的信息流。信息流用来描述现实世界中一些事物的某些方面的特征及事物间的相互联系。在处理信息流前,必须先对其进行分析,并用一定的方法加以描述,然后将描述转换成计算机所能接受的数据形式。
2.1.1 信息的现实世界
现实世界泛指存在于人脑之外的客观世界。信息的现实世界是指我们要管理的客观存在的各种事物、事物之间的相互联系及事物的发生、变化过程。通过对现实世界的了解和认识,使得我们对要管理的对象、管理的过程和方法有一个概念模型。认识信息的现实世界并用概念模型加以描述的过程称为系统分析。信息的现实世界通过<实体+特征+实体集+联系>进行划分和认识。
(1)实体
现实世界中存在的可以相互区分的事物或概念称为实体(Entity)。实体可以分为事物实体和概念实体,例如,一个学生、一台设备、一个职工、一部汽车等是事物实体,一门课、一个班级等称为概念实体。
(2)实体的特征
每个实体都有自己的特征(Characteristic),利用实体的特征可以区别不同的实体。例如,学生通过姓名、性别、年龄、身高、体重等许多特征来描述自己。尽管实体具有许多特征,但是我们在研究时,只选择其中对管理及处理有用的或有意义的特征。例如,对于人事管理,职工的特征可选择姓名、性别、年龄、工资、职务等;而在描述一个人健康情况时,可以用职工的身高、体重、血压等特征表示。
(3)实体集及实体集之间的联系
具有相同特征或能用同样特征描述的实体的集合称为实体集(Entity Set)。例如,学生、工人、汽车等都是实体集。实体集不是孤立存在的,它们之间有着各种各样的联系,例如,学生和课程之间有“选课”联系,教师和教学系之间有“工作”联系。
2.1.2 信息世界
现实世界中的事物反映到人们的头脑里,经过认识、选择、命名、分类等综合分析而形成了印象和概念,从而得到了信息。当事物用信息来描述时,即进入了信息世界。
在信息世界中:
实体的特征在头脑中形成的知识称为属性。
实体通过其属性表示称为实例。
同类实例的集合称为对象,对象即实体集中的实体用属性表示得出的信息集合。
实体与实例是不同的,例如,张三是一个实体,而“张三,男,25岁,计算机系学生”是实例,现实世界中的张三除了姓名、性别、年龄和所在系外还有其他的特征,而实例仅对需要的特征通过属性进行了描述。在信息世界中,实体集之间的联系用对象联系表示。
信息世界通过概念模型(也称信息模型)、过程模型和状态模型反映现实世界,它要求对现实世界中的事物、事物间的联系和事物的变化情况准确、如实、全面地表示。
概念模型通过E-R图中的对象、属性和联系对现实世界的事物及关系给出静态描述。
过程模型通过信息流程图和数据字典描述事物的处理方法和信息加工过程。
状态模型通过事物状态转换图对事物给出动态描述。
三种模型的作用如下:数据库主要是根据概念模型设计的,而数据处理方法主要是根据过程模型设计的,状态模型对数据库的系统功能设计有重要的参考价值。
2.1.3 信息的计算机世界
信息世界中的信息,经过数字化处理形成计算机能够处理的数据,就进入了计算机世界(机器世界、数据世界)。在信息转换为数据的过程中,对计算机硬件和软件(软件主要指数据库管理系统)都有限定,所以,信息的表示方法和信息处理能力要受到计算机硬件和软件限制。也就是说,数据模型应符合具体计算机系统和DBMS的要求。
在计算机世界中会用到下列术语。
(1)数据项
数据项(Item)是对象属性的数据表示。数据项有型和值之分,都要符合数据的编码要求。
型——对数据特性的表示,它通过数据项的名称、数据类型、数据宽度和值域等来描述。比如:学号,可以存储为字符型,15个字符宽。
值——其具体取值。比如:1418855232。
(2)记录
记录(Record)是实例的数据表示。记录有型和值之分。
型是结构,由数据项的型构成。
值表示对象中的一个实例,它的分量是数据项值。
例如,“姓名,性别,年龄,所在系”是学生数据的记录型,而“张三,男,23,计算机系”是一个学生的记录值,它表示学生对象的一个实例,“张三”“男” “23”“计算机系”都是数据项值。
(3)文件
文件(File)是对象的数据表示,是同类记录的集合。即同一个文件中的记录类型应是一样的。例如,将所有学生的登记表组成一个学生数据文件,文件中的每条记录都要按“姓名,性别,年龄,所在系”的结构组织数据项值。
(4)数据模型
现实世界中的事物反映到计算机世界中就形成了文件的记录结构和记录,事物之间的相互联系就形成了不同文件间的记录的联系。记录结构及其记录联系的数据化的结果就是数据模型(Data Model)。
2.1.4 三个世界之间的对应关系
现实世界、信息世界和计算机世界这3个领域是由客观到认识、由认识到使用管理的3个不同层次,后一领域是前一领域的抽象描述。3个领域之间的术语对应关系可由表2-1表示。
表2-1 信息的三种世界术语的对应关系表
现实世界、信息世界和计算机世界的转换关系可以用图2-1表示。
图2-1 信息的三种世界的联系和转换过程
从图2-1中可以看出,现实世界的事物及联系,通过系统分析成为信息世界的信息模型,而信息模型经过数据化处理转换为数据模型。