/json5_parser

parser for json5

Primary LanguageC++Apache License 2.0Apache-2.0

json5_parser

https://github.com/tearshark/json5_parser

一个支持json5的json解析器。
解析器和DOM拆分为两个部分,以便于外部定制DOM实现。

可以通过开关 JSON_ENABLE_JSON5 控制是否支持json5

一、问题

目前已知问题:对字符串标准支持较弱。

二、效率

在I7 8700K 3.7GHz(OC 4.3GHz),使用VS 2019 / clang 9.0.0编译(取成绩好的编译器结果),测试data目录下附带的三个json,获得数据如下:

1、关闭json5选项,开启simd选项
dummy
benchmark_json5_parser parse file: ./data/canada.json
parse 2251060 bytes cost 2.01487 s, speeds is 852.372 MB/s
benchmark_json5_parser parse file: ./data/twitter.json
parse 631514 bytes cost 0.42715 s, speeds is 1127.96 MB/s
benchmark_json5_parser parse file: ./data/citm_catalog.json
parse 1727204 bytes cost 0.845587 s, speeds is 1558.39 MB/s

DOM
benchmark_json5_parser parse file: ./data/canada.json
parse 2251060 bytes cost 2.40061 s, speeds is 715.41 MB/s
benchmark_json5_parser parse file: ./data/twitter.json
parse 631514 bytes cost 0.458313 s, speeds is 1051.26 MB/s
benchmark_json5_parser parse file: ./data/citm_catalog.json
parse 1727204 bytes cost 0.914645 s, speeds is 1440.73 MB/s

benchmark_rapidjson parse file: ./data/canada.json
parse 2251060 bytes cost 2.91519 s, speeds is 589.128 MB/s
benchmark_rapidjson parse file: ./data/twitter.json
parse 631514 bytes cost 1.20984 s, speeds is 398.239 MB/s
benchmark_rapidjson parse file: ./data/citm_catalog.json
parse 1727204 bytes cost 1.48519 s, speeds is 887.261 MB/s

注一:dummy仅测试解析器的效率,不保存任何解析结果。

注二:DOM由附带的 rapid_dom_handler 实现,没有正确转义字符串,用于需要快速定位json用。


项目 编译器 json文件 文件大小(Bytes) 重复次数 用时(秒) 速度(MB/S)
json5_parser(dummy) clang canada.json 2251060 800 2.01487 852.372
json5_parser(dummy) clang twitter.json 631514 800 0.42715 1127.96
json5_parser(dummy) clang citm_catalog.json 1727204 800 0.845587 1558.39
json5_parser(DOM) clang canada.json 2251060 800 2.40061 715.41
json5_parser(DOM) clang twitter.json 631514 800 0.458313 1051.26
json5_parser(DOM) clang citm_catalog.json 1727204 800 0.914645 1440.73
rapidjson clang canada.json 2251060 800 2.91519 589.128
rapidjson clang twitter.json 631514 800 1.20984 398.239
rapidjson clang citm_catalog.json 1727204 800 1.48519 887.261

2、开启json5选项,开启simd选项
dummy
benchmark_json5_parser parse file: ./data/canada.json
parse 2251060 bytes cost 2.37301 s, speeds is 723.732 MB/s
benchmark_json5_parser parse file: ./data/twitter.json
parse 631514 bytes cost 0.453873 s, speeds is 1061.55 MB/s
benchmark_json5_parser parse file: ./data/citm_catalog.json
parse 1727204 bytes cost 1.00962 s, speeds is 1305.19 MB/s

DOM
benchmark_json5_parser parse file: ./data/canada.json
parse 2251060 bytes cost 2.55664 s, speeds is 671.749 MB/s
benchmark_json5_parser parse file: ./data/twitter.json
parse 631514 bytes cost 0.473795 s, speeds is 1016.91 MB/s
benchmark_json5_parser parse file: ./data/citm_catalog.json
parse 1727204 bytes cost 1.08489 s, speeds is 1214.64 MB/s

项目 编译器 json文件 文件大小(Bytes) 重复次数 用时(秒) 速度(MB/S)
json5_parser(dummy) clang canada.json 2251060 800 2.37301 723.732
json5_parser(dummy) clang twitter.json 631514 800 0.453873 1061.55
json5_parser(dummy) clang citm_catalog.json 1727204 800 1.00962 1305.19
json5_parser(DOM) clang canada.json 2251060 800 2.55664 671.749
json5_parser(DOM) clang twitter.json 631514 800 0.473795 1016.91
json5_parser(DOM) clang citm_catalog.json 1727204 800 1.08489 1214.64

按照习惯,走一波广告:

如果你发现了任何bug、有好的建议、或使用上有不明之处,可以提交到issue,也可以直接联系作者:

email: tearshark@163.net
QQ交流群: 296561497


json5

基于json5_parser的json5完整库。

类型 说明 别名
enum js_type 描述 json5 的值的类型 enum js_type
js_string 用于存储 json5 的String类型 std::string / std::wstring
js_string_view 用于引用 json5 的String类型 std::string_view
js_variant variant<int64_t, double, js_string, bool, js_object_ptr, js_array_ptr, nullptr_t, monostate>
js_value 代表 json5 的一个值,提供 check<>() / get<>() / set<>() 方法便于操作 js_variant
js_interface js_array / js_object 的公共基类,提供两者全部的接口。
并提供 opt<>() 方法便于跳过 js_value 直接操作数据
js_array 代表 json5 的Array类型
js_object 代表 json5 的Ojbect类型
js_pointer
js_parser json5 解析器 js_parser
js_writer virtual void push_back(LPCXSTR, size_t) = 0;
js_buffer_writer 写入到 js_string 的 js_writer : js_writer
js_cfile_writer 写入到 C 文件(FILE*) 的 js_writer : js_writer
js_write_handler 将 json5 格式化成文本输出到 js_writer : js_sax_handler
js_dom_handler 将 js_parser 的结果输出成 js_interface : js_sax_handler
js_codecvt 用于扩展字符串编码的模板类
js_value_convertor 用于扩展直接与更多类型进行交互的模板类
js_dump_walker void js_dump_walker(const js_value& jv, js_sax_handler* handler);
js_to_string js_string js_to_string(const js_value& jv, int tabstop = 0);
js_from_string js_interface_ptr js_from_string(LPCXSTR psz, LPCXSTR pszEnd);
js_interface_ptr js_from_string(LPCXSTR psz, intptr_t length = -1);
js_interface_ptr js_from_string(const js_string_view str);
operator "" _js js_interface_ptr operator "" _js(const char* psz, size_t cnt);
wjs_interface_ptr operator "" _js(const wchar_t* psz, size_t cnt);
operator "" _jsp js_pointer operator "" _jsp(const char* psz, size_t cnt);
wjs_pointer operator "" _jsp(const wchar_t* psz, size_t cnt);