Linux - 实现一个简单的 shell

前言

之前我们对进程的替换，进程地址空间等等的概念进行了说明，本篇博客会基于这些知识点来实现一个简单的 shell ，如有疑问，可以参考下述博客：
Linux - 进程程序替换 - C/C++ 如何实现与各个语言之间的相互调用 - 替换环境变量-CSDN博客

Linux - 进程控制（下篇）- 进程等待-CSDN博客

Linux - 进程控制（上篇）- 进程创建和进程终止-CSDN博客

Linux - 进程地址空间-CSDN博客

Linux - 环境变量 - 常规命令和内建命令-CSDN博客

因为本博客当中试下的 shell 只是非常简单的版本，全局上的变量基本只有父进程在使用，所以，很多的变量和数组都是定义在全局当中的，其实这样是不好的，但是本篇博客的意义在于理解 Linux 当中 bash 的大概实现，而不是着手实现一个 shell。

简单 shell 实现

在之前的博客当中，我们说，其实 Linux 当中的 bash（命令行解释器），本质上就是创建子进程，创建完之后，这个子进程就是我们在命令行当中运行命令的可执行文件生成的进程。那么，为什么可以实现 bash 创建的子进程执行其他的可执行程序当中的代码呢？其实就是实现了进程替换，进程替换会替换掉原本进程当中除环境变量之外的代码和数据，所以，在替换之后，是从0 开始执行新的程序的。

这就是整个过程。

而，像我们使用 "ls" "pwd" "cd" 这些命令，其实都是一个一个的可执行程序，一般是存储在 Linux 当中的 bin 目录下的，这也是 Linux 默认的 PATH 执行目录之一。

所以，当我们在命令行当中输入某一个系统当中存在的命令之时，或者是运行我们自己书写的程序，本质上都是 bash 创建子进程，然后把这个子进程当中代码和数据和新的进程（可能是命令，也可能是我们的自己编写的程序）的代码和数据进行替换。

然后在从 0 开始执行这个新的程序，所以，bash 就实现了一个解析命令的作用。

首先我们来理解在屏幕上打印的这些，和我们输入的命令到底是什么？

在之前的一大串，其实本质上就是一个字符串，在这个字符串当中有当前用户名，主机名，目录名等等信息，这些信息都是在环境变量当中有体现的：

而后面我们输入的**"ls l -a" 这个命令** ，其实本质上就是我们输入了一个++字符串++，bash 解析命令也是通过这个字符串来实现的。

而bash 解析这个命令也只是把这个字符串，按照空格或者其他方式把这个字符串分隔为了多个字符串，然后，再把这些个字符串作为参数，利用 exec*()系列函数，传入到替换的新的程序当中，所以，怎么运行，还是靠这个命令的可执行程序本身。

所以，现在我们先来解决一个问题，就是在控制台当中打印前面一大串信息（命令行的打印）的实现：

构建一个简单的命令行

如果想获取到类似 bash 的命令行当中一样的信息，我们除了可以利用一些系统调用接口来获取之外，其实，通过环境变量来获取也是可以的。这些信息在环境变量当中都是有的：

通过这些环境变量，就可以获取到我们想要的信息。

上述就是我构建的命令行，输出：

接下来是搞定用户输入命令，我们要++保存用户输入的命令++，才能进行解析：

首先，因为用户输入命令是一个字符串，在这个字符串当中，不仅仅有字符和字母，还用用于分开各个选项参数的之前的关系的++空格++。

所以，我们不能用 C 当中的 scanf（）这个函数来实现，因为 scanf（）这个函数，读取缓冲区当中的数据之时，读到 "\n" 或者是空格就会结束读取，而用户在输入命令之时，不得避免的要输入空格来分隔各个选项。

如果要是用 scanf（）函数读取多个字符串的话，在格式化输出当中，每一个字符串都要写上 "%s" 来识别这个字符串，但是，我们不清楚用户要输入多少个字符串，所以这种方式是很挫的。虽然可以使用一些通配符来实现读取一行字符出纳，但是，有个函数可以更方便的实现读取一行字符串。所以，scanf（）明显不能满足我们的要求。

我们期望的是，从何命令行当中获取一样的字符串。所以，可以使用 fgets（）函数来实现：

其中的 stream，可以是我们打开的文件对象；其实在 Linux 当中系统启动之时自动会打开的 stdin ，stdout ， stderr 这三个流，所以，fgets（）函数直接从 stdin 当中读取数据就行了。

此时我们就存储到了用户输入的命令字符串：

因为用户输入的字符串当中，就算用户什么字符字母都没有输入，但是当用户按下回车的时候，"\n" 也是输入了，也就是说， fgets（）函数不会读取失败，最少都是要读取一个 "\n" 。

所以，我们上述拿到的字符串是不干净的，不管用户怎么输入，在字符串当中都是有一个 "\n" 。所以，我们在读取到 commandline 字符串数组当中，那这个 "\n" 给清楚 ：

像上述就把用户输入的字符串给优化为我们想要的命令字符串了。

识别保存用户输入的命令，我们把它分装成一个函数：

命令的解析

现在，上述只是从用户的输入当中保存到了用户输入的命令，但是，这个命令还是我们不是我们最终想要的命令我们还需要把这么命令做解析，把这个字符串解析出多字符串，然后解析出的字符串才是我们想要的命令和命令的参数。

而且，在拿到我们想要的字符串之后，我们还要向办法把这些个字符串都存储起来，也就是，每一个字符串的地址保存在哪里呢？

很简单，就是用 ++字符串指针数组++来存储，数组当中一个元素存储的一个字符串，这就类似于 main（）函数的 argv 参数，存储外部调用这个程序所使用的命令的参数一样。

定义字符串指针数组：

关于切割，可以使用 strtok（）函数，这个函数就可以帮助我们每一次调用，按照空格为分隔符，切割出一个子字符串。

所以，我们可以这样写：

此时我们就可以，测试一下，上述是否达到分隔字符串的目录：

输出：

发现，此时在 argc 数组当中，各个元素就存储了用户输入的各个命令和参数。

创建子进程，进行子进程代码和数据替换（程序替换），实现运行用户输入的命令的操作。

在前言的程序替换这篇博客当中说了什么是程序替换，bash 在执行用户输入的命令的时候，就是创建子进程，然后把用户执行的命令（本质上也是一个可执行程序），把这个可执行程序当中的代码替换到子进程当中，从0 开始执行；此时，子进程就在执行用户输入的命令对应的可执行程序了。

所以，现在我们也是要实现类似的操作。

先是创建子进程：

父进程当中的等待的一些操作，现在先不写，先完成子进程当中的 ++程序替换操作++：

程序替换有 6 个库函数可以使用，这里使用 ++execvpe（）++ 函数，因为我们存储命令的方式就是使用数组的方式来存储的，而且，我们实现的简单 shell 就是让他去完成一些系统当中的命令操作，所以没用 PATH 环境变量当中默认的路径就可以了。最后的 e 就是环境变量，这里我们还是自己传入（其实不用自己传也是可以的，子进程会继承父进程当中的环境变量）

至此，子进程当中的程序替换部分，就已经实现了，现在我们运行我们的 shell，已经可以运行系统当中的命令了 ：

当然，目前我们还没有写 shell 的结束方式，所以，目前是死循环在执行的。

我们自己写的 shell 在运行之时会遇见的问题：

当然，++上述只是实现一个简单的程序替换，一些比较复杂的功能，比如 vim 还是会报出一下错误的；ll 也就是 ls - l 的简写也是不行的；因为我们现在实现的 shell 和 Linux 当中的 shell 差别还是蛮大的++。

但是，不重要，因为上述的简单的模块，已经可以帮助我们理解很多的 shell 当中是如何进行解析的，如果执行用户输入的命令的···· 起码上述是能运行系统当中的很多命令的。

再次理解何为内建命令

而且不止上述的问题，当我们使用 cd 命令移动当前位置之时，比如 cd .. 移动到上级路径：

发现，++当前路径没有改变。++

++当我们切换路径之时，一点用都没有++。

我们先来理解为什么不能？

当我们想要运行一个命令的可执行程序的时候，我们上述的操作是无脑的把子进程当中的代码进行替换，所以，实际上，我们在命令行当中运行这个命令的可执行文件，不是父进程再跑，而是这个子进程再跑。但是我们++运行的命令行是父进程啊++，我们在屏幕上看到的路径是父进程所在路径，所以，我们在屏幕上是看不到的。

换句话说，进程之间是具有独立性的，就算刚开始父子进程共用一个代码和数据，但是一旦其中某一个进程对代码和数据进行了修改，都会发生写时拷贝 。++那么子进程执行 cd 命令，跟父进程有什么关系呢？++

没有关系！！

所以，不是cd 命令不能再我们实现的 shell 当中运行，而是 cd 是在子进程当中运行的，而我们看到的路径是父进程的。子进程执行菜cd命令到上级目录，根目录··· 一直输入cd 命令，子进程夸夸跑，但是，一次cd 命令执行完，子进程就退出了，跟父进程有什么关系呢？

所以，++我们不能单独的把这种需要影响到父进程的命令无脑的使用子进程的进程替换++ 来实现，换句话说，++这样命令，不能让子进程去跑，而是让父进程去跑。这样的命令，称之为 -- 内建命令。++

而所有的内建命令都是在 shell 当中一个一个的函数来进行一个个命令的处理的，本质上，++内建命令本质上就是一个一个的在shell 当中实现的函数。++

实现 cd

要解决上述 cd 的话，就需要特殊判断，判断，如果当前用户输入的命令是 cd 命令的话，就进行特殊处理。

怎么处理呢？其是在系统当中是有一些系统调用函数的，比如++chdir （）++ 这个函数就可以帮助我们 ++更改当前进程的一个工作路径++。

由上述可知，在 chdir 函数当中传入一个路径，那么就可以更改的到这个路径当中，所以，因为用户输入的命令是一个字符串，而且已经被我们解析出了，在我们存储解析的字符串指针数组当中目的第一个元素，就是用户输入的命令的名称。使用 strcmp（）函数判断 argv $0$ 这个元素和 "cd" 这个字符串是否是一样的，来判断当前用户输入的是不 cd 命令。

而且，因为用户在使用 cd 命令之时，一定是 cd 加上一个绝对路径或者是相对路径，所以，cd 的命令解析出来的字符串指针数组一定是一个两个元素以上的。

其实此时使用 chdir（）函数就可以实现修改家目录的效果：

如上就是我们在 shell 当中自己实现的 cd 内建命令。

但是，我打印当前工作路径的方式是按照 PWD 这个工作目录来打印的，如果我们单独的按照 PWD 来打印的话，此时 PWD 在自己实现的 cd命令修改之后是不会修改的，所以，shell 打印的命令行当中，打印当前工作目录的字符串还是保存之前的工作目录的字符串，不是修改之后的工作目录的字符串：

此时我们查看当前的PWD环境变量：

++PWD++ 保存还是发现还是 ++原来父进程的工作路径++。

所以，++我们在 shell 当中不能仅仅是修改父进程的当前工作路径，还应该修改 PWD，因为我们是靠 PWD 这个环境变量来在命令行当中打印当前父进程（也就是shell）的工作路径的。++

如何修改，其实在系统当中专门有这个的调用接口： ++getcwd（）函数，获取当前的工作路径++：

他可以把当前的工作路径，以字符串的形式覆盖到 buf 这个字符串当中。

所以，我们每一次执行 cd 这内建命令，就要重新刷新一下 PWD 环境变量当中值。

++我们可以一个字符串数组来存储 PWD 当中的值：++

这个 pwd 数组是全局的。

那么我们在 getpwd（）函数当中就不能这样写了，不能直接使用 getenv（）函数来直接获取到 PWD 的值，而是要使用 getcwd（）函数来刷新一下当前 PWD 的值，刷新到当前的工作路径：

此时，我们在打印命令行的函数当中，把 getpwd（）先调用，目的是刷新一下 PWD 环境变量，然后再把 pwd 传入到 printf（）当中作为工作目录的字符串：

此时我们在实现之时就可以实现命令行当中工作目录的实时打印了：

其他一些内建命令实现

cpp 复制代码

int buildCommand(char *_argv[], int _argc)
{
    if(_argc == 2 && strcmp(_argv[0], "cd") == 0){
        chdir(argv[1]);
        getpwd();
        sprintf(getenv("PWD"), "%s", pwd);
        return 1;
    }
    else if(_argc == 2 && strcmp(_argv[0], "export") == 0){
        strcpy(myenv, _argv[1]);  // 方式修改 _argv[1] 这个指针修改的到 myenv 环境变量
        putenv(myenv);
        return 1;
    }
    else if(_argc == 2 && strcmp(_argv[0], "echo") == 0){
        if(strcmp(_argv[1], "$?") == 0)
        {
            printf("%d\n", lastcode);
            lastcode=0;
        }
        else if(*_argv[1] == '$'){
            char *val = getenv(_argv[1]+1);
            if(val) printf("%s\n", val);
        }
        else{
            printf("%s\n", _argv[1]);
        }

        return 1;
    }

    // 特殊处理一下ls
    if(strcmp(_argv[0], "ls") == 0)
    {
        _argv[_argc++] = "--color";
        _argv[_argc] = NULL;
    }
    return 0;
}

上述多了一个 strcpy （）多拷贝一次，是因为，系统当中添加环境变量，不是把字符串当中的内容拷贝到环境变量的存储空间当中，而是把这个字符串的首元素地址拷贝到环境变量表当中。所以，如果我们直接使用 _argv\[\] 这个数组来作为环境变量的字符串地址的话，那么就可能会修改到 _argv\[\] 某一个元素之时，就会修改到这个环境变量。

环境变量表当中存储的不是字符串这个字符串，而是这些个字符串的首元素地址。

因为，环境变量当中存储的数据是很重要的，所以，不能随便定义一个空间，就把这个空间作为这个环境变量表当中维护的空间，因为shell 当中不知道这个空间是否会被其他人所修改，shell 要自己维护一块空间来作为存储环境变量的空间。

总结（shell 导入环境变量的方式）

所以，当系统运行起来的时候，或者说我们进行登录的时候，系统就是要运行一个 shell 程序。比如在 Linux 当中就是 bash 命令行解释器。

而，我们知道各个进程的环境变量是来自于 bash 父进程的，那么 bash 的环境变量从那里来呢？

其实在自己用户，当前的工作目录下，有一写配置文件，如 Linux 当中 ++.bash_profile++ 这个文件当中：

所以，++当用户登录的时候，shell 会读取当前用户目录下的 .bash_profile 这个配置文件，在个文件当中存储了环境变量导入到方式，其实这个文件也就是一个 shell 脚本文件，进行命令解释执行之后，就创建了当前我们所使用的环境变量。++

完整代码：