We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
単なるコメントも歓迎と言って頂けたので…
PDF 版 P.259 に
ただ、逆に高い桁から記録する場合、BOMが0000feffとなるのですが、上の出力のように、iconvはBOMを付けてくれません。
0000feff
iconv
との記載があります。
この記載だと何となく iconv が不親切な印象を受けてしまうので、以下のような記載の方が望ましい気がしました。
ただ、逆に高い桁から記録する場合、BOMが付くとすれば0000feffとなるはずですが、上の出力のようにUTF-32BEではBOMは付きません。
UTF-32BE
仕様としてUTF-32BEにはBOMは存在せず、仮に先頭に0000feffが存在してしまうと本来の意味である zero width no-break space(ZWNBSP)と解釈されてしまいます(仕様にも明記されている)。
ちなみに、BOM 付き UTF-8(?)を iconv で UTF-32 に変換してみたところ UTF-8 の先頭は ZWNBSP と解釈されるようで、先頭は 0000feff 0000feff になってしまうようです(これに関連した記載も仕様に記載されている)。
UTF-32
0000feff 0000feff
個人的には BOM 付き UTF-8 なるナゾなものは別のエンコーディングスキーム名を割り当てるべきだと思うんですけど…
The text was updated successfully, but these errors were encountered:
ありがとうございます。調査不足でした。次の版で脚注を入れるかもしれません。READMEにこのissueのリンクを張りました。一旦クローズで。
Sorry, something went wrong.
No branches or pull requests
単なるコメントも歓迎と言って頂けたので…
PDF 版 P.259 に
との記載があります。
この記載だと何となく
iconv
が不親切な印象を受けてしまうので、以下のような記載の方が望ましい気がしました。仕様として
UTF-32BE
にはBOMは存在せず、仮に先頭に0000feff
が存在してしまうと本来の意味である zero width no-break space(ZWNBSP)と解釈されてしまいます(仕様にも明記されている)。ちなみに、BOM 付き UTF-8(?)を
iconv
でUTF-32
に変換してみたところ UTF-8 の先頭は ZWNBSP と解釈されるようで、先頭は0000feff 0000feff
になってしまうようです(これに関連した記載も仕様に記載されている)。個人的には BOM 付き UTF-8 なるナゾなものは別のエンコーディングスキーム名を割り当てるべきだと思うんですけど…
The text was updated successfully, but these errors were encountered: