
1.1 数据与数据处理
数据库技术是一门研究如何存储、使用和管理数据的技术,是计算机数据管理技术的最新发展阶段。数据库应用涉及数据、信息、数据处理和数据管理等基本概念。
1. 数据和信息
数据(Data)和信息(Information)是数据处理中的两个基本概念,有时可以混用,如我们平时讲的数据处理就是信息处理,但有时必须分清。一般认为,数据是对客观事物的某些特征及相互联系的一种抽象化、符号化表示,即数据是人们用于记录事物情况的物理符号。为了描述客观事物而用到的数字、字符及所有能输入到计算机中并能被计算机处理的符号都可以看作是数据。在实际应用中,有两种基本形式的数据。一种是可以参与数值运算的数值型数据,如表示成绩、工资的数据;另一种是由字符组成、不能参与数值运算的字符型数据,如表示姓名、职称的数据。此外,还有图形、图像、声音、动画和视频等多媒体数据,如照片、商标等。
信息是数据中所包含的意义。通俗地讲,信息是经过加工处理并对人类社会实践和生产活动产生决策影响的数据。例如,“周丹丹”“湖南”“575”只是单纯的数据,而“周丹丹同学来自湖南,入学成绩为575分”就是一条有意义的信息。不经过加工处理的数据只是一种原始材料,对人类活动产生不了决策作用,它的价值只是在于记录了客观世界的事实。只有经过提炼和加工,使数据发生质的变化,才能成为信息。
数据与信息既有区别,又有联系。一方面,数据是用来表示信息的,是承载信息的物理符号;信息是加工处理后的数据,是数据所表达的内容。另一方面,信息不随表示它的数据形式而改变,它是反映客观现实世界的知识;而数据则具有任意性,用不同的数据形式可以表示同样的信息。例如,一个城市的天气预报情况是一条信息,而描述该信息的数据形式可以是文字、图像或声音等。
2. 数据处理和数据管理
数据处理是指将数据转换成信息的过程,其基本目的是从大量的、杂乱无章的、难以理解的数据中整理出对人们有价值、有意义的数据(即信息),作为决策的依据。例如,全体考生各门课程的考试成绩记录了考生的考试情况,属于原始数据,对考试成绩进行分析和处理,如按成绩从高到低顺序排列、统计各分数段的人数等,进而可以根据招生人数确定录取分数线,输出的数据即包含丰富的信息。
数据管理是指数据的收集、组织、存储、检索和维护等操作,这些操作是数据处理的中心环节,是任何数据处理业务中不可缺少的一部分。数据管理的基本目的是实现数据共享,降低数据冗余,提高数据的独立性、安全性和完整性,从而能更加有效地管理和使用数据资源。