日本中学生创造了一门“类似中文”的编程语言

软件工程师、技术图书译者。译有《计算机是怎样跑起来的》《自制搜索引擎》《图解云计算架构》等。

natsuakane 是一名日本的中学生(13 岁),他创造了一门类似中文的编程语言 Wei-lang(github.com/natsuakane/...)。用他自己的日式汉语来介绍就是"我制作偽中国語之機械言語"。

Wei 是"伪"的拼音,lang 是 language 的缩写。下面我们就通过一段计算斐波那契数列第 n 项的代码,来看看 Wei-lang 的特点。

関数「普伊墓那値」引数「数」行
「結果」是「数」
「数」大一場合「結果」是「普伊墓那値」(「数」引二)足「普伊墓那値」(「数」引一)
「結果」
終

「表示」(「普伊墓那値」(「入力」(『整数』)))
「表示」(「新行」)

将这段代码存储到文件 fibonacci.wei 中,然后用 weilang 命令解析这个文件,并输入 10,

shell 复制代码
$ ./weilang fibonacci.wei
10
55

这段代码输出了 55,这正是斐波那契数列的第 10 项。

Wei-lang 与主流编程语言最大的不同点就是代码中充满了汉字,所有标点符号也都是全角符号(使用半角空格作缩进反而会出错)。

若将这段代码翻译成 Python 代码,大概是这样,

python 复制代码
def fibonacci(num):
    result = num
    if num > 1:
        result = fibonacci(num - 2) + fibonacci(num - 1)
    return result

print(fibonacci(int(input())), end='')
print("\n", end='')

我们注意到,在 Wei-lang 的代码中,有些汉字括在了「」之中。这些汉字构成了函数、参数和变量的名字。

例如 「数」 相当于 Python 代码中名为 num 的参数;「結果」 相当于名为 result 的局部变量。「表示」「入力」 后面都带有 (),应该不难猜出它们是函数名。"表示"和"入力"这两个日文单词的含义分别是"显示"和"输入",所以对应 print()input() 函数。

在主流编程语言中,函数名和变量名等标识符要么是英文和数字的组合(如 C、Java、Go 等),要么是以特殊的符号开头,比如 PHP 中的 $var,MySQL 中的 @var。像 「数」 这种前后都需要特殊符号的写法从未出现过。不过,用一对括号将参数括起来也有好处,这样在函数的参数列表中,就可以省略 , 分隔符了,例如 (「甲」「乙」),中间就不需要再加逗号了。

「普伊墓那値」 这个函数名中的每个汉字我们都认识,但合在一起就完全不知道什么意思了。这其实是日语中的借用字(当て字),即不考虑汉字原本的含义,仅使用汉字来表示外来语读音的现象。类似咱们小时候刚学英语时,用汉字标注单词读音的做法。

Wei-lang 在函数返回值方面还有点 Rust 的风格,最后一个表达式,即 「結果」 的值就是函数的返回值。

代码中还有些汉字没有括在「」之中,除了表示数字的零一二三四五六七八九,剩下的那些汉字相当于运算符和关键字。如 関数 相当于 Python 中的 def,表示开始定义函数。 相当于赋值的 = 相当于比较运算符 > 来自日语的引く和足す,分别表示减法和加法;場合 一词多出现在日语中表示"如果......就......"的句子中,正好对应 if 语句。

从出现位置上可以判断出分别对应 C、Java 等语言中的 {}。从含义上看,用 作为表示结束的 } 还挺合适的,不过 和表示开始的 { 有什么关联暂时没有想到。

另外,"行"字可以拆开成"彳""亍"(chì chù)两个字,其实这两个字本身就有左右的含义。彳表示左步;亍表示右步, 彳亍合在一起指缓步慢行。这两个字曾用于翻译量子力学中也有左右之分的狄拉克符号。


虽然作者 natsuakane 自称 Wei-lang 是类似中文的编程语言,但很多汉字的用法并不符合汉语习惯,所以更准确的说法可能是"Wei-lang 是一门汉字编程语言"。

Wei-lang 是用 C++实现的,源代码只有不到 1800 行。尽管代码量不大,Wei-lang 依然具备了基本的编程语言功能,而且采用了编译原理中的 LL(1) 自顶向下分析法,并利用了多态、组合设计模式等编程技巧,很难相信这些代码竟出自一位中学生之手。

natsuakane 曾表示,思考如何才能写出像中文一样的代码很有意思。

相关推荐
17´4 小时前
使用QT+OpenCV+C++完成一个简单的图像处理工具
c++·图像处理·qt·opencv
苹果4 小时前
C++二十三种设计模式之迭代器模式
c++·设计模式·迭代器模式
飞yu流星5 小时前
C++ 函数 模板
开发语言·c++·算法
Goldinger6 小时前
vscode 配置c/c++环境 中文乱码
c语言·c++·vscode
nSponge6 小时前
【Duilib】 List控件支持多选和获取选择的多条数据
c++·windows·工具
Y Shy7 小时前
Windows C++开发环境:VSCode + cmake + ninja + msvc (cl.exe) + msys2/bash shell
c++·windows·vscode·msvc·cmake·msys2·ninja
越甲八千7 小时前
详细全面讲解C++中重载、隐藏、覆盖的区别
开发语言·c++
只做开心事8 小时前
C++之闭散列哈希表
c++·哈希算法·散列表
智驾8 小时前
SOLID原则学习,单一职责原则(Single Responsibility Principle)
c++·单一职责原则·solid
daopuyun9 小时前
C/C++编程安全标准GJB-8114解读——名称、符号与变量使用类
java·c语言·c++