1 章 C语言概述

第 1 章 C语言概述

如果有人说"我想要一种语言,只需对它说我要干什么就行",给他一支棒棒糖好了。1

1每章章首的警句均选自Alan J. Perlis的文章"Epigrams on Programming"。该文发表在ACM SIGPLAN Notices(美国计算机协会编程特别兴趣小组会刊)1982年9月号第7~13页。

什么是C语言?它是20世纪70年代初期在贝尔实验室开发出来的一种广为使用的编程语言。这一简单回答显然没能传达出C语言的特别之处。不过别急,在深入学习这门语言之前,让我们先来回顾一下C语言的起源、设计目标和这么多年来的发展(1.1节)。我们还将讨论C语言的优缺点,以及如何高效地使用C语言(1.2节)。

1.1 C语言的历史

本节对C语言的历史做一个简单的回顾,从它的起源到它成为一种标准化语言,再到它对近代编程语言的影响。

1.1.1 起源

C语言是贝尔实验室的Ken Thompson、Dennis Ritchie等人开发的UNIX操作系统的"副产品"。Thompson独自编写出UNIX操作系统的最初版本,这套系统运行在DEC PDP-7计算机上。这款早期的小型计算机仅有8KB内存(毕竟那是在1969年)。

与同时代的其他操作系统一样,UNIX系统最初也是用汇编语言编写的。用汇编语言编写的程序往往难以调试和改进,UNIX系统也不例外。Thompson意识到需要用一种更加高级的编程语言来完成UNIX系统未来的开发,于是他设计了一种小型的B语言。Thompson的B语言是在BCPL语言(20世纪60年代中期产生的一种系统编程语言)的基础上开发的,而BCPL语言又可以追溯到最早(且影响最深远)的语言之一 ------Algol 60语言。

不久,Ritchie也加入到UNIX项目中,并且开始着手用B语言编写程序。1970年,贝尔实验室为UNIX项目争取到一台PDP-11计算机。当B语言经过改进并能够在PDP-11计算机上成功运行后,Thompson用B语言重新编写了部分UNIX代码。到了1971年,B语言已经明显不适合PDP-11计算机了,于是Ritchie着手开发B语言的升级版。最初,他将新开发的语言命名为NB语言(意为"New B"),但是后来新语言越来越偏离B语言,于是他将其改名为C语言。到了1973年,C语言已经足够稳定,可以用来重新编写UNIX系统了。改用C语言编写程序有一个非常重要的好处:可移植性。只要为贝尔实验室的其他计算机编写C语言编译器,他们的团队就能让UNIX系统也运行在那些机器上。

1.1.2 标准化

C语言在20世纪70年代(特别是1977年到1979年之间)持续发展。这一时期出现了第一本有关C语言的书。Brian Kernighan和Dennis Ritchie合作编写的《C程序设计语言》一书于1978年出版,并迅速成为C程序员必读的"圣经"。因为当时没有C语言的正式标准,所以这本书就成了事实上的标准,编程爱好者把它称为K&R或者"白皮书"。

在20世纪70年代,C程序员相对较少,而且他们中的大多数人是UNIX系统的用户。然而,到了20世纪80年代,C语言已不再局限于UNIX领域。运行在不同操作系统下的多种类型的计算机都开始使用C语言编译器,特别是迅速壮大的IBM PC平台也开始使用C语言。

随着C语言的迅速普及,一系列问题接踵而至。编写新的C语言编译器的程序员都用K&R作为参考。但遗憾的是,K&R对一些语言特性的描述非常模糊,以至于不同的编译器常常会对这些特性做出不同的处理。而且,K&R也没有对属于C语言的特性和属于UNIX系统的特性进行明确的区分。更糟糕的是,K&R出版以后C语言仍在不断变化,增加了新特性并且去除了一些旧的特性。很快,C语言需要一个全面、准确的最新描述开始成为共识。如果没有这样一种标准,就会出现各种"方言",这势必威胁到C语言的主要优势------程序的可移植性。

1983年,在美国国家标准学会(ANSI)的推动下,美国开始制订本国的C语言标准。经过多次修订,C语言标准于1988年完成并在1989年12月正式通过,成为ANSI标准X3.159-1989。1990年,国际标准化组织(ISO)通过了此项标准,将其作为ISO/IEC 9899:1990国际标准。我们把这一C语言版本称为C89或C90,以区别于原始的C语言版本(经典C)。附录D总结了C89和经典C之间的主要差异。

1995年,C语言发生了一些改变(相关描述参见Amendment 1文档)。1999年通过的ISO/IEC 9899:1999新标准中包含了一些更重要的改变,这一标准所描述的语言通常称为C99。由于存在两种标准,以前用于描述C89的ANSI C、ANSI/ISO C和ISO C等术语现在就有了二义性。

C语言的最近两次改变分别发生在2011年和2018年。国际标准化组织在2011年通过的C语言标准是ISO/IEC 9899:2011,这一标准所描述的C语言通常称为C11;在2018年通过的C语言标准是ISO/IEC 9899:2018,这一标准所描述的C语言通常称为C18。

从C99到C11再到C18的变化,没有从C89到C99那么显著。尤其是从C11到C18的变化,仅限于技术修正和澄清,总体上没有显著的改变,也没有引入新的语言特性。

在本书第1版发行的时候,C99还没有得到普遍使用,并且我们需要维护数百万(甚至数十亿)行的旧版本C代码,因此本书中我将用一个特殊图标

来标记对C99新增特性的讨论。不能识别这些新增特性的编译器就不是"C99兼容的"。附录C列出了C99和C89的主要区别。因为从C11到C18的变化不大,所以没有将它们分开单独讨论,并且用一个特殊的图标

来标记从C11开始引入的新特性。附录B列出了C1X和C99的主要区别。

1.1.3 基于C的语言

C语言对现代编程语言有着巨大的影响,许多现代编程语言都借鉴了大量C语言的特性。在众多基于C的语言中,以下几种非常具有代表性。

考虑到这些新语言的普及程度,人们自然会问:"C语言还值得学习吗?"我想答案是肯定的,原因如下:第一,学习C有助于更好地理解C++、Java、C#、Perl以及其他基于C的语言的特性,而一开始就学习其他语言的程序员往往不能很好地掌握继承自C语言的基本特性;第二,目前仍有许多C程序,我们需要读懂并维护这些代码;第三,C语言仍然广泛用于新软件开发,特别是在内存或处理能力受限的情况下以及需要使用C语言简单特性的地方。

如果读者还没有学习上述任何一种基于C的语言,那么本书是一本非常好的预备教材。本书强调了数据抽象、信息隐藏和其他在面向对象编程中非常重要的原理。C++语言包含了C语言的全部特性,因此读者今后在使用C++语言时可以用到从本书中学到的所有知识。在其他基于C的语言中也能发现许多C语言的特性。

1.2 C语言的优缺点

与其他任何编程语言一样,C语言也有自己的优缺点。这些优缺点都源于该语言的最初用途(编写操作系统和其他系统软件)和它自身的基础理论体系。

1.2.1 C语言的优点

C语言的众多优点有助于解释为什么这种语言如此流行。

1.2.2 C语言的缺点

C语言的缺点和它的许多优点是同源的,均来自C语言与机器的紧密结合。下面是众所周知的几个问题。

混乱的C语言

即使是那些最热爱C语言的人也不得不承认C代码难以阅读。每年一次的国际C语言混乱代码大赛(International Obfuscated C Code Contest, IOCCC)竟然鼓励参赛者编写最难以理解的C程序。获奖作品着实让人感觉莫名其妙,例如1991年的"最佳小程序":

v,i,j,k,l,s,a

99

; main() { for(scanf("%d",&s);*a-s;v=a

j*=v

-a

,k=i=s*k&&++a

--i

) ; }

这个程序是由Doron Osovlanski和Baruch Nissenbaum共同编写的,其功能是打印出八皇后问题(此问题要求在一个棋盘上放置8个皇后,使得皇后之间不会出现相互"攻击"的局面)的全部解决方案。事实上,此程序可用于求解皇后数量在4~99范围内的全部问题。更多的获奖程序可以到IOCCC网站获取。

1.2.3 高效地使用C语言

高效地使用C语言要求在利用C语言优点的同时要避免它的缺点。下面是一些建议。

问与答

问:设置"问与答"的目的是什么?

答:很高兴有此一问。"问与答"将出现在每章的结尾。设置它主要有以下几个目的。

最主要的目的是解决学生学习C语言时经常遇到的问题。读者可以在此(从某种意义上说)与作者对话,这种形式非常像是读者置身于作者的C语言课堂一般。

另一个目的是为对应章中涉及的某些主题提供额外的信息。本书的读者可能会有不同的知识背景。有些读者可能具有其他编程语言的经验,而另外一些读者可能是第一次学习编程。有多种语言经验的读者也许会满足于简要的说明和几个示例,而那些缺少经验的读者则需要更多讲解。最基本的原则是,如果你觉得哪个主题讲得不够详细,可以查阅"问与答"部分以获取更多的信息。

必要时,"问与答"中会讨论多种C编译器的常见差异。例如,我们将介绍一些由特定编译器提供的频繁使用(但未标准化)的特性。

问:lint是做什么的?(p.5)

答:lint检查C程序中潜在的错误,包括(但不限于)可疑的类型组合、未使用的变量、不可达的代码以及不可移植的代码。lint会产生一系列程序员有必要从头到尾仔细阅读的诊断信息。使用lint的好处是,它可以检查出被编译器漏掉的错误。但我们需要记得使用lint,因为它太容易被忘记了。更糟的是,lint可以产生数百条信息,而这些信息中只有少部分指出了实际错误。

问:lint这个名字是如何得来的?

答:与其他许多UNIX工具不同,lint不是缩写。它的命名是因为它像在程序中"吹毛求疵"。

问:如何获得lint?

答:如果使用UNIX系统,那么会自动获得lint,因为它是一个标准的UNIX工具。如果采用其他操作系统,则可能没有lint。幸运的是,lint的各种版本都可以从第三方获得。在许多Linux发行版中都包含lint的增强版本splint(Secure Programming Lint),这一工具可以免费下载。

问:有没有办法在不使用lint的情况下强制编译器进行更彻底的错误检查?

答:有。大多数编译器能根据我们的要求进行更彻底的检查。除了检查错误(毫无疑问违背C语言规定的情况)外,大多数编译器还提供警告,指出可能存在问题的地方。有些编译器具有多个"警告级别",选择较高的级别能发现更多问题。如果你的编译器支持多级警告,建议选择最高级别,以便编译器执行其能力范围内最彻底的检查。第2章的"问与答"部分讨论了GCC(2.1节)的错误检查选项,GCC是随Linux操作系统发布的。

* 问:我很关心能让程序尽可能可靠的方法。除了lint和调试工具以外,还有其他有效的工具吗?4

4星号标注的问题包含过于超前或者过于深奥的内容,而且常常涉及后续章节中的知识,普通读者可能不感兴趣。建议感兴趣且有一定编程经验的读者可以认真钻研一下,其他读者在初次阅读时可以先跳过这部分内容。

答:有的。其他常用的工具包括越界检查工具(bounds-checker)和内存泄漏监测工具(leak-finder)。C语言不要求检查数组下标,而越界检查工具增加了此项功能。内存泄漏监测工具帮助定位"内存泄漏",即那些动态分配却从未被释放的内存块。

该标准对应的中国国家标准是GB/T 15272---1994。C语言目前的最新标准是2018年修订的ISO 9899:2018(称为C18)。------编者注 本书由人民邮电出版社于2008年出版。------编者注

相关推荐
玖玥拾3 小时前
C/C++ 数据结构(五)链表的应用、对象池
c语言·数据结构·c++·链表·对象池·双向链表
三品吉他手会点灯3 小时前
C语言学习笔记 - 48.流程控制2 - 什么是流程控制
c语言·开发语言·笔记·学习
AI thought4 小时前
C语言、C++与C#深度研究报告:从底层控制到现代企业级开发的演进
c语言·c++·c·内存管理·编译模型
我命由我123454 小时前
RFID 技术极简理解
java·c语言·c++·嵌入式硬件·物联网·visualstudio·java-ee
格发许可优化管理系统4 小时前
Mentor许可证与其他软件许可证的深度比较
java·大数据·运维·c语言·c++·算法
程序员zgh4 小时前
C++ 万能引用与完美转发
c语言·开发语言·c++·经验分享·学习
不会C语言的男孩5 小时前
Linux 系统编程 · 第 9 章:进程创建
linux·c语言·开发语言
AI+程序员在路上5 小时前
CSP、PP、PV、HM 在 CiA402 标准下的差异解析
linux·c语言·开发语言·嵌入式硬件
Seraphina_Lily6 小时前
深入底层:函数栈帧的建立、销毁与SP指针的本质
c语言