IDS data for GB2312
基于 GB2312 汉字集的 IDS(Ideographic Description Sequence) 数据集。
包括了 GB2312 中的所有 6763 个汉字 (其中一级汉字 3755 个,二级汉字 3008 个) 的 IDS 描述。
GB2312 数据集来源:http://tools.jb51.net/table/gb2312
表意描述序列来源:https://github.com/cjkvi/cjkvi-ids
IDS 是一种通常用来描述中、日、韩文的文字结构的一种方式。
IDS 由 IDC(Ideographic Description Characters) 组成。本数据集涉及到的 IDC 可以在 idc.txt 中查找到。
因为本数据集的 IDS 内容是从 cjkvi-ids 中提取,因此 License 也遵从 GPLv2 协议。