C++实现一个简易版的ParseC

ParseC 最初出现在 Haskell 社区,是一个很方便的实现 Parser 的工具,它定义了一个很简洁的 Parser 模型,并围绕这个模型,结合 Haskell 本身的语法特性,构建了一个强力的工具库。在 C++中我们依然可以吸取它的思想,利用 C++的语法特性实现一个类似的工具。

基础模型

整个模型可以被概括为两个基本的理念:(1)复杂的 Parser 可以通过一系列简单的 Parser 组合得到;(2)Parser 可以定义为一个将字符串变换为解析结果和剩余字符串的映射。借助代码一个 Parser 可以抽象为这样一个映射:

rust 复制代码
type Parser a = String -> Maybe (a, String)

那么在 C++中,可以定义如下对等的产物

arduino 复制代码
#include <optional>
#include <string_view>
#include <tuple>

template <typename T>
using ParserRet = std::optional<std::tuple<T, std::string_view>>;

template <typename T>
using Parser = std::function<ParserRet<T>(std::string_view)>;

一些基本的 Parser

在实现复杂的 Parser 之前,我们需要一些基础的 Parser 来提供最基础的单元,这些基础的 Parser 具备一定的普适性。

char parser

首先来实现一个最简单的 Parser,这个 Parser 仅仅解析出一个字符'h'

arduino 复制代码
ParserRet<char> h_parser(std::string_view s) {
  if(s.empty() || s.at(0) != 'h') {
    return std::nullopt;
  }
  
  return std::make_tuple('h', s.substr(1));
}

观察可以发现,上面函数里的模式是具有普遍性的,可以进行第一步推广,推广为解析各个指定的字符

arduino 复制代码
ParserRet<char> char_parser(char c, std::string_view s) {
  if (s.empty() || s.at(0) != c) {
    return std::nullopt;
  }
  return std:make_tuple(c, s.substr(1)); 
}

前面的h_parser 就可以改写为

rust 复制代码
Parser<char> h_parser = std::bind(char_parser, 'h', std::placeholder::_1); 

或者写成lambda表达式的形式

rust 复制代码
Parser<char> h_parser = [](std::string_view s) -> ParserRet<char> {
  return char_parser('h', s); 
};

更近一步,如果想要能解析满足更灵活诉求的字符,可以进一步推广上面的Parser为

c 复制代码
Parser<char> satisify_parser(std::function<bool(char)> f, std::string_view s) {
  if (s.empty() || !f(s.at(0))) {
    return std::nullopt;
  }
  return std::make_tuple(s.at(0), s.substr(1)); 
}

上面的h_parser 可以改写为

rust 复制代码
Parser<char> char_parser = std::bind(
    satisify_parser,
    [](char c) -> bool {
      return c == 'h';
    },
    std::placeholder::_1);

string parser

类似的,可以实现解析特定字符串的Parser

c 复制代码
ParserRet<std::string> string_parser(std::string target, std::string_view s) {
  if (s.empty() || s.substr(0, target.size()) != target) {
    return std::nullopt;
  }
  return std::make_tuple(target, s.substr(target.size()));
}

基于此,采用类似的思路,可以实现类似解析数字,整数,小数,括号,标点等常见的元素。

相关推荐
oioihoii1 小时前
C++11 forward_list 从基础到精通:原理、实践与性能优化
c++·性能优化·list
m0_687399841 小时前
写一个Ununtu C++ 程序,调用ffmpeg API, 来判断一个数字电影的视频文件mxf 是不是Jpeg2000?
开发语言·c++·ffmpeg
Ronin3052 小时前
【C++】类型转换
开发语言·c++
mrbone113 小时前
Git-git worktree的使用
开发语言·c++·git·cmake·worktree·gitab
虾球xz4 小时前
CppCon 2018 学习:EFFECTIVE REPLACEMENT OF DYNAMIC POLYMORPHISM WITH std::variant
开发语言·c++·学习
津津有味道5 小时前
Qt C++串口SerialPort通讯发送指令读写NFC M1卡
linux·c++·qt·串口通信·serial·m1·nfc
让我们一起加油好吗6 小时前
【C++】list 简介与模拟实现(详解)
开发语言·c++·visualstudio·stl·list
傅里叶的耶6 小时前
C++系列(二):告别低效循环!选择、循环、跳转原理与优化实战全解析
c++·visual studio
Vitta_U6 小时前
MFC的List Control自适应主界面大小
c++·list·mfc
Dovis(誓平步青云)7 小时前
基于探索C++特殊容器类型:容器适配器+底层实现原理
开发语言·c++·queue·适配器·stack