normalize-unicode function - BaseX-Talk - mailman.uni-konstanz.de

27 Jun 2012


      Hi,
I tried some Japanese letters in fn:normalize-unicode.
FULLWIDTH DIGIT, FULLWIDTH LATIN CAPITAL LETTER:
  fn:normalize-unicode("１２３４５６７８９０ａｂｃｄｅｆｇ", "NFKC")
  returns 1234567890abcdefg
FULLWIDTH EXCLAMATION MARK:
  fn:normalize-unicode("！", "NFKC")
  returns !
FULLWIDTH LESS-THAN SIGN, ?FULLWIDTH GREATER-THAN SIGN:
  fn:normalize-unicode("＜＞", "NFKC")
  returns &lt;&gt;
FULLWIDTH AMPERSAND;
  fn:normalize-unicode("＆", "NFKC")
  returns?&amp;
These are normal. but,
FULLWIDTH QUOTATION MARK, FULLWIDTH APOSTROPHE:
  fn:normalize-unicode("”’", "NFKC")
  returns ”’
In this case, I think that &quot;&apos; should be returned.
Best regards,
Toshio HIRAI