登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
1
2
/ 2 页
下一页
返回列表
首页
›
业界区
›
业界
›
Unicode中如何表示未收录的生僻字 --浅谈IDS ...
Unicode中如何表示未收录的生僻字 --浅谈IDS
[ 复制链接 ]
陆菊
2025-12-23 00:30:04
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
Unicode中的字符结构表示
Unicode标准是一个全球普遍接受的文字编码标准,它的理想是用一个巨大的字符集来表示世界上所有的字符,这样让全球的文字交流置于同一种体系之下,避免以前出现过的不同国家不同字符集互不统一造成的乱码,极大方便了全球的电子信息交流。
汉字是Unicode标准中内容最为庞大的子字符集,与英语等不同,汉字是每个字符有自己独立的意思,因此占用的字符数量巨大。目前Unicode 17标准中有15万个字符,中日韩统一汉字就占到了10万个以上。
但是即使是收字量如此之大,目前也无法涵盖汉字的所有字符,特别是手书时代有无数种不同的汉字变体或自造字,因此有大量字符是目前没有收录过的。另外还有一些新造的少量字符用于科技领域。这些未收入标准中的字符,就没有规定它们的字形。那这样的字符,应该怎么在电脑或手机等文本中表示它们呢?(文本方式之外,还是有很多办法的,图片,矢量图形,特殊的文件格式表示等等,但文本是最简洁最易交流的方式,使用频繁,甚至连化学结构的表达都有人发明SMILES文本来表达)。
为了在电脑时代表示这些字符,以前用过这样的用法,比如歘字在早期的字体中不存在,为了表示这个字,我们就用文字表示为“左焱右欠”,或者是“焱欠”,这是不得已的情况下变通表示,让读者能够理解的一种无奈的方法,它的缺点就是不太好表达更为复杂的结构。
因此,Unicode中提供了一种类似的方法,英文叫做Ideographic Description Characters, 中文翻译成 表意文字描述符,通过这些表示结构的字符与汉字部件结合来表示一个字的结构。因为定义了专门的表示结构的字符,其表达能力就大大增强了。
首先看标准中提供的表示结构的专用符号(来自wiki百科)
这种表示法的结构,是先放一个结构符号,后面提供表示结构的部件。
比如前面提到的歘字,用IDS来表示表示,就是 ⿰焱欠,第一个字符表示这个字是左右结构,相当于文本描述的 左X右Y;接着是从左到右(或从上到下)的部件,分别是焱、欠。这样读者就可以明白,这个表示一个组合字, 左右结构,从左到右分别是焱和欠。
当然,有些字形比较复杂,可能由多个部件构成,需要更进一步的拆分才能表达出来,因此用IDS的表示法可以进行嵌套表示。比如焱,如果没有这个字符,这种品字型的结构,可以把它拆分为上下结构,下部继续拆解为左右结构。因此 ⿰焱欠 可以继续写成
⿰⿱火⿰火火欠。
这种结构的解析顺序,从左到右,没有括号来表达优先级。上面这串字符,按从左到右解读,意思是说,整个字是左右结构(⿰);左边是上下结构(⿱),上面部件是火字,左边下面部件是左右组合的结构(⿰火火)。最后,右边是个欠字。
解读时要特别注意表示的结构中有几个部件,后面就要对应消耗几个部件。上例中,左边上部消耗一个火字,下面是左右结构,又消耗两个火字。最后剩下的欠字,对应着左右结构中的右边部件。
你肯定能明白,拆解的粒度与方法并不一定是唯一的,选择的部件也未必是唯一的,只要能准确表示结构就行。
这种表示方法开始用时,如果结构比如复杂可能不太好懂,需要多练习一下。为了方便练习,有个网站zi.tools提供了这种表示法的练习工具。有意思的是,这个网站还提供了检索具有特定结构的字符的功能,贴个图大家就很容易明白了,用?代表搜索的部件即可。
这里隐藏了一个问题,即这些表示结构的符号如何输入,最简单的方法就是你在zi.tools这个网站上把字拆好,然后把右边的框内生成的文字复制过来。我猜测一般的输入法应该不包括这种不太常用的符号。
最后,展示一下
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
Unicode
如何
表示
收录
生僻
相关帖子
实时行情系统的第一道槛:如何应对数据源的“限流”与“断流”
如何使用 UEFI Shell 执行 Hello World 程序
如何优雅地为 OpenClaw 安装 skill 技能包
如何优雅地为 OpenClaw 安装 skill 技能包
DB和缓存如何保证一致性
DB和缓存如何保证一致性
DB和缓存如何保证一致性
DB和缓存如何保证一致性
DB和缓存如何保证一致性
AI时代如何临摹项目:Vault跨项目持久化存储系统
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
实时行情系统的第一道槛:如何应对数据源的“限流”与“断流”
2
707
人弧
2026-04-01
业界
如何使用 UEFI Shell 执行 Hello World 程序
2
700
剽达崖
2026-04-01
安全
如何优雅地为 OpenClaw 安装 skill 技能包
1
13
喳谍
2026-04-02
安全
如何优雅地为 OpenClaw 安装 skill 技能包
0
748
都硎唷
2026-04-02
安全
DB和缓存如何保证一致性
3
537
咪四
2026-04-05
安全
DB和缓存如何保证一致性
0
32
兜蛇
2026-04-05
安全
DB和缓存如何保证一致性
0
857
仇华乐
2026-04-05
安全
DB和缓存如何保证一致性
0
482
赏听然
2026-04-05
安全
DB和缓存如何保证一致性
0
198
唯棉坜
2026-04-05
业界
AI时代如何临摹项目:Vault跨项目持久化存储系统
0
490
户烫擞
2026-04-06
回复
(24)
旱由
2025-12-23 23:59:39
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢发布原创作品,程序园因你更精彩
简千叶
2025-12-25 13:03:14
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
前排留名,哈哈哈
章海
2026-1-14 21:25:00
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
新版吗?好像是停更了吧。
幌斛者
2026-1-15 17:04:30
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享,下载保存了,貌似很强大
缢闸
2026-1-18 08:14:16
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
yyds。多谢分享
艺轫
2026-1-21 11:11:22
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
缄戈
2026-1-22 20:01:46
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,试用一下
后彼
2026-1-24 23:29:01
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
凉砧掌
2026-1-27 02:26:42
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
鼓励转贴优秀软件安全工具和文档!
毋献仪
2026-1-27 08:14:16
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
yyds。多谢分享
丘娅楠
2026-1-29 20:44:51
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
东西不错很实用谢谢分享
闻成
2026-2-4 11:44:26
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
不错,里面软件多更新就更好了
战匈琼
2026-2-8 04:16:40
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢发布原创作品,程序园因你更精彩
稼布欤
2026-2-9 11:24:21
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
yyds。多谢分享
决台
2026-2-10 06:09:43
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
东西不错很实用谢谢分享
百谖夷
2026-2-10 12:58:38
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
碣滥
2026-2-10 16:59:46
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
劳怡月
2026-2-12 05:16:36
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
溜椎干
2026-2-12 10:43:29
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
热心回复!
下一页 »
1
2
/ 2 页
下一页
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
陆菊
2026-2-12 10:43:29
关注
0
粉丝关注
27
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991126
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9517
6
韶又彤
9909
7
荪俗
8991
8
宋子
9875
9
蓬森莉
9868
10
俞瑛瑶
10000
查看更多
今日好文热榜
294
程序员AI编程之提示词【学习笔记】
802
Tcache attack
850
AgileAI - 一个新的 .NET AI 库
301
OpenClaw AI助手本地部署完整教程
24
AI 编程助手 + 基于 CLI 的 Manus 实现(Ja
716
React 技术深度探讨
259
从分形到森林——使用 Three.js 创建逼真的
563
React 技术深度探讨
1002
React 技术深度探讨
470
【读书笔记】【CUDA编程指南】CUDA简介
870
React 技术深度探讨
6
hal库总结学习
931
"Natural-Language Agent Harnesses" 论文
846
自我即自感:一种极简存在论
79
Microsoft Agent Framework + Kimi API 实
354
【节点】[Posterize节点]原理解析与实际应
6
【小记】解决校园网中单播互通的不同子网间
760
GitHub 热门项目 Top 10 | 2026 年 04 月 0
196
Spring Cloud Gateway实战:微服务API网关
791
罗兰艺境GEO内容工程实战复盘:CSDN 92分技