]> git.ipfire.org Git - thirdparty/gettext.git/commitdiff
Localization of proper names.
authorBruno Haible <bruno@clisp.org>
Mon, 3 Apr 2006 11:28:01 +0000 (11:28 +0000)
committerBruno Haible <bruno@clisp.org>
Tue, 23 Jun 2009 10:13:06 +0000 (12:13 +0200)
gettext-tools/lib/propername.c [new file with mode: 0644]
gettext-tools/lib/propername.h [new file with mode: 0644]

diff --git a/gettext-tools/lib/propername.c b/gettext-tools/lib/propername.c
new file mode 100644 (file)
index 0000000..9a707da
--- /dev/null
@@ -0,0 +1,198 @@
+/* Localization of proper names.
+   Copyright (C) 2006 Free Software Foundation, Inc.
+   Written by Bruno Haible <bruno@clisp.org>, 2006.
+
+   This program is free software; you can redistribute it and/or modify
+   it under the terms of the GNU General Public License as published by
+   the Free Software Foundation; either version 2, or (at your option)
+   any later version.
+
+   This program is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+   GNU General Public License for more details.
+
+   You should have received a copy of the GNU General Public License
+   along with this program; if not, write to the Free Software Foundation,
+   Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
+
+#ifdef HAVE_CONFIG_H
+# include "config.h"
+#endif
+
+/* Specification.  */
+#include "propername.h"
+
+#include <stdio.h>
+#include <stdlib.h>
+#include <string.h>
+#if HAVE_ICONV
+# include <iconv.h>
+#endif
+
+#include "localcharset.h"
+#include "c-strcase.h"
+#include "iconvstring.h"
+#include "strstr.h"
+#include "xalloc.h"
+#include "gettext.h"
+
+
+/* Return the localization of NAME.  NAME is written in ASCII.  */
+
+const char *
+proper_name (const char *name)
+{
+  /* See whether there is a translation.   */
+  const char *translation = gettext (name);
+
+  if (translation != name)
+    {
+      /* See whether the translation contains the original name.  */
+      if (strstr (translation, name) != NULL)
+       return translation;
+      else
+       {
+         /* Return "TRANSLATION (NAME)".  */
+         char *result =
+           (char *) xmalloc (strlen (translation) + 2 + strlen (name) + 1 + 1);
+
+         sprintf (result, "%s (%s)", translation, name);
+         return result;
+       }
+    }
+  else
+    return name;
+}
+
+#if HAVE_ICONV
+
+static char *
+convert_name (const char *locale_code, const char *name_utf8)
+{
+  /* Open conversion descriptor.  */
+  iconv_t conv_from_utf8 = iconv_open (locale_code, "UTF-8");
+
+  if (conv_from_utf8 != (iconv_t)(-1))
+    {
+      char *name_converted = NULL;
+      size_t length;
+
+      /* Convert the name to the locale encoding.  */
+      if (iconv_string (conv_from_utf8,
+                       name_utf8, name_utf8 + strlen (name_utf8) + 1,
+                       &name_converted, &length) == 0)
+       /* Verify that the converted string is terminated.  */
+       if (!(length > 0 && name_converted[length - 1] == '\0'))
+         abort ();
+
+      /* Free the conversion descriptor.  */
+      iconv_close (conv_from_utf8);
+
+      return name_converted;
+    }
+  else
+    return NULL;
+}
+
+#endif
+
+/* Return the localization of a name whose original writing is not ASCII.
+   NAME_UTF8 is the real name, written in UTF-8 with octal or hexadecimal
+   escape sequences.  NAME_ASCII is a fallback written only with ASCII
+   characters.  */
+
+const char *
+proper_name_utf8 (const char *name_ascii, const char *name_utf8)
+{
+  /* See whether there is a translation.   */
+  const char *translation = gettext (name_ascii);
+
+  /* Try to convert NAME_UTF8 to the locale encoding.  */
+  const char *locale_code = locale_charset ();
+  char *alloc_name_converted = NULL;
+  char *alloc_name_converted_translit = NULL;
+  const char *name_converted = NULL;
+  const char *name_converted_translit = NULL;
+  const char *name;
+
+  if (c_strcasecmp (locale_code, "UTF-8") != 0)
+    {
+#if HAVE_ICONV
+      /* Avoid glibc-2.1 bug with EUC-KR.  */
+# if (__GLIBC__ - 0 == 2 && __GLIBC_MINOR__ - 0 <= 1) && !defined _LIBICONV_VERSION
+      if (strcmp (locale_code, "EUC-KR") != 0)
+# endif
+       {
+         name_converted = alloc_name_converted =
+           convert_name (locale_code, name_utf8);
+
+# if (__GLIBC__ == 2 && __GLIBC_MINOR__ >= 2) || __GLIBC__ > 2 \
+     || _LIBICONV_VERSION >= 0x0105
+         {
+           size_t len = strlen (locale_code);
+           char *locale_code_translit = (char *) xmalloc (len + 10 + 1);
+           memcpy (locale_code_translit, locale_code, len);
+           memcpy (locale_code_translit + len, "//TRANSLIT", 10 + 1);
+
+           name_converted_translit = alloc_name_converted_translit =
+             convert_name (locale_code_translit, name_utf8);
+
+           free (locale_code_translit);
+         }
+# endif
+       }
+#endif
+    }
+  else
+    {
+      name_converted = name_utf8;
+      name_converted_translit = name_utf8;
+    }
+
+  /* The name in locale encoding.  */
+  name = (name_converted != NULL ? name_converted :
+         name_converted_translit != NULL ? name_converted_translit :
+         name_ascii);
+
+  if (translation != name_ascii)
+    {
+      /* See whether the translation contains the original name.
+        A multibyte-aware strstr() is not absolutely necessary here.  */
+      if (strstr (translation, name_ascii) != NULL
+         || (name_converted != NULL
+             && strstr (translation, name_converted) != NULL)
+         || (name_converted_translit != NULL
+             && strstr (translation, name_converted_translit) != NULL))
+       {
+         if (alloc_name_converted != NULL)
+           free (alloc_name_converted);
+         if (alloc_name_converted_translit != NULL)
+           free (alloc_name_converted_translit);
+         return translation;
+       }
+      else
+       {
+         /* Return "TRANSLATION (NAME)".  */
+         char *result =
+           (char *) xmalloc (strlen (translation) + 2 + strlen (name) + 1 + 1);
+
+         sprintf (result, "%s (%s)", translation, name);
+
+         if (alloc_name_converted != NULL)
+           free (alloc_name_converted);
+         if (alloc_name_converted_translit != NULL)
+           free (alloc_name_converted_translit);
+         return result;
+       }
+    }
+  else
+    {
+      if (alloc_name_converted != NULL && alloc_name_converted != name)
+       free (alloc_name_converted);
+      if (alloc_name_converted_translit != NULL
+         && alloc_name_converted_translit != name)
+       free (alloc_name_converted_translit);
+      return name;
+    }
+}
diff --git a/gettext-tools/lib/propername.h b/gettext-tools/lib/propername.h
new file mode 100644 (file)
index 0000000..e9e3d9d
--- /dev/null
@@ -0,0 +1,42 @@
+/* Localization of proper names.
+   Copyright (C) 2006 Free Software Foundation, Inc.
+   Written by Bruno Haible <bruno@clisp.org>, 2006.
+
+   This program is free software; you can redistribute it and/or modify
+   it under the terms of the GNU General Public License as published by
+   the Free Software Foundation; either version 2, or (at your option)
+   any later version.
+
+   This program is distributed in the hope that it will be useful,
+   but WITHOUT ANY WARRANTY; without even the implied warranty of
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+   GNU General Public License for more details.
+
+   You should have received a copy of the GNU General Public License
+   along with this program; if not, write to the Free Software Foundation,
+   Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
+
+#ifndef _PROPERNAME_H
+#define _PROPERNAME_H
+
+
+#ifdef __cplusplus
+extern "C" {
+#endif
+
+/* Return the localization of NAME.  NAME is written in ASCII.  */
+extern const char * proper_name (const char *name);
+
+/* Return the localization of a name whose original writing is not ASCII.
+   NAME_UTF8 is the real name, written in UTF-8 with octal or hexadecimal
+   escape sequences.  NAME_ASCII is a fallback written only with ASCII
+   characters.  */
+extern const char * proper_name_utf8 (const char *name_ascii,
+                                     const char *name_utf8);
+
+#ifdef __cplusplus
+}
+#endif
+
+
+#endif /* _PROPERNAME_H */