U+2f04
U+4e59 乙
在使用 itext 的 html2pdf 生成 PDF 文件,发现一个奇怪的问题。 举个例子,我的原始文本是:乙方。这个乙方就是输入法正常打出来的乙方,拼音:yifang 。Unicode 为 U+4e59 。
但是生成的 PDF 文件,却变成了:。Unicode 为 U+2f04 。拼音查不出来,好像因为是一个部首?
我是用的思源宋体的粗体,然后产生了这个问题。后面我换了一个字体,狮尾四季春。PDF 生成的文字就正常了,生成的也是乙方。拼音:yifang 。Unicode 为 U+4e59 。
我去查了一下,确实这是 2 个字符:
- https://charbase.com/2f04-unicode-kangxi-radical-second
- https://charbase.com/4e59-unicode-cjk-unified-ideograph
但是思源宋体也是同时有这 2 个字符:
那导致这个转换不一致的原因是什么呢?
- 我看了下 html2pdf 的源码 debug ,找了半天没找到关于字体这里转换字符的逻辑。
- 但是我想了下,原始文本是乙方,乙的 Unicode 是 U+4e59 ,那应该 html2pdf 在思源宋体里面找 U+4e59 编码的字符使用就好了,但这里不应该会找错啊?
困扰了半天了,求助下了解的大佬~








