-
Notifications
You must be signed in to change notification settings - Fork 20
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
求有空的程序员朋友写一个五笔编码编辑与查询软件 #1
Comments
打算在CNMan/UnicodeCJK-WuBi06#20 基础上作一点改进. 一些业务问题(个人不是五笔用户, 所以问题小白请见谅):
|
本项目成品就是一个Unicode字符对应五笔编码的基础数据库,现实意义就是所有Unicode汉字能用五笔输入。 五笔编码编校是长期行为,并非单次校对所能完成。
|
就是说, 这个数据库的目的是确保, 所有unicode的汉字能够用最新的五笔编码正确输入? 还有几个问题:
|
是的
需要
|
为避免修改多字之后忘记导出, 感觉最好是每次"修改"之后就自动保存到字符原来所处的CJK-*文件, 也就不用"导出文件"了. 这样是否合适? 另外还缺的功能:
|
需求就是保存到源文件,这样就不用二次处理了,能修改后自动保存当然更好了 |
按照github文档, 修改git配置如下:
之后git diff输出看起来正确:
如果不改autocrlf, git diff显示所有行都被修改, 行尾加了^M. 没找到更好的解决方法. |
改进:
如有后续问题请在https://github.com/program-in-chinese/wubi_code_editor 开issue. 就不再watch这个repo了. |
好的,多谢了
这真是不会编程但又有编程需求的人群的福音 |
在v2ex也有发,在这里再整理一下:
先说一下:无偿,请不要喷我。也不要在此讨论五笔各版本及其与拼音、手写等其他输入法的优劣、存亡等。
我在做新世纪版五笔字型 Unicode CJK 超大字符集编码数据库,9 月底应该能完成 Unicode 11.0.0 全部 CJK 字符的初校。7.17 项目开始,已持续 2 个月了,过程相当枯燥、苦逼...
最近在想,如果把前辈们已经搞完的 86 版、98 版编码放在一起,互相借鉴、印证,该是多好的的一件事。但我不会编程,才来求助各位。
软件初衷的使用对象是五笔编码编、校人员,所以功能上“编辑”为主,“查询”为次。
五笔是形码输入法,字形决定编码,编码校对时应包括“字形校对”和“编码校对”,其中“字形校对”尤为重要。由于Unicode采用的“认同”体系,中国大陆、中国港/澳/台、日本、韩/朝、越南等东亚地区的汉字字形各不相同。同时,国标“正形”后的标准字形与Unicode标准字形也有差异,需要仔细校对。目前的校对基本使用记事本等文本编辑器,只能设定单一字体,字形差异不容易被发现,因此五笔编码编、校软件应支持同时展示多种字体字形来解决这个重要问题。
除去字形,笔顺也是极为重要的一环。键外字拆分规则:书写顺序、取大优先、兼顾直观、能连不交、能散不连。第一条就与笔顺相关,可惜王码五笔并不是完全按照中国大陆笔顺规范编码,部分汉字是按照中国台湾笔顺编码的。作为用户主要在中国大陆的五笔输入法,个人认为应统一按照中国大陆笔顺规范来编码。
现在不比 10 来年前 86、98 版超大字符集编码时有很多人参与,后来增加的 CJK 字符编码基本都靠个人之力完成,三个版本也就主要是三个人而已。
当然,查询功能适用所有五笔用户,目前也有同类软件、APP、网页等,还能显示拆分结构等更多信息,但字符集基本都是 GBK 或 GB18030-2000 ( CJK+CJK-A )
软件的需求大致如下:
GUI 草图
数据源
https://github.com/CNMan/UnicodeCJK-WuBi
txt 编码:UTF-8
txt 格式:
txt 列分隔符:
,
软件数据库应直接采用本项目的
CJK*.txt
文本字形展示
为避免系统Fallback导致字形错乱,软件采用 BabelMap 导出的字体图片展示字形
字形图片展示区应可以同步展示多种字形,包括:中国大陆字形、中国台港澳字形、日本字形
字体图形框:90*90 px,居中显示,不缩放,无背景色
字形图片文件名格式统一为 U_XXXXXX.png(或gif)( XXXXXX 为大写的 6 位 Unicode 编码,不足 6 位则前面补 0 )
字形图片文件按平面分文件夹存放,软件应根据Unicode编码所在平面查找对应的图片进行展示
字形文件夹对应表格如下:
以下9种字体的48 pt PNG格式图片已全部添加到UnicodeCJK-FontGlyphs:
查询框
支持小写自动转大写
支持四位、五位、六位 Unicode 编码
上一个、下一个
顺序为Unicode编码顺序
修改、编辑、保存按钮
按下“修改按钮”后,编码区变为可编辑状态,“修改按钮”变为“保存按钮”,也可以分开
数据保存格式
将结果直接保存到相应的源
txt
中多谢!
The text was updated successfully, but these errors were encountered: