]> git.ipfire.org Git - thirdparty/babel.git/commitdiff
Add icu4c-tools
authorAarni Koskela <akx@iki.fi>
Tue, 4 Mar 2025 12:10:29 +0000 (14:10 +0200)
committerAarni Koskela <akx@iki.fi>
Wed, 5 Mar 2025 09:39:01 +0000 (11:39 +0200)
misc/icu4c-tools/.gitignore [new file with mode: 0644]
misc/icu4c-tools/Makefile [new file with mode: 0644]
misc/icu4c-tools/README.md [new file with mode: 0644]
misc/icu4c-tools/icu4c_date_format.cpp [new file with mode: 0644]

diff --git a/misc/icu4c-tools/.gitignore b/misc/icu4c-tools/.gitignore
new file mode 100644 (file)
index 0000000..e660fd9
--- /dev/null
@@ -0,0 +1 @@
+bin/
diff --git a/misc/icu4c-tools/Makefile b/misc/icu4c-tools/Makefile
new file mode 100644 (file)
index 0000000..0f1d5d1
--- /dev/null
@@ -0,0 +1,3 @@
+bin/icu4c_date_format: icu4c_date_format.cpp
+       mkdir -p bin
+       $(CXX) -Wall -std=c++17 -o $@ $^ $(shell pkg-config --cflags --libs icu-uc icu-i18n)
diff --git a/misc/icu4c-tools/README.md b/misc/icu4c-tools/README.md
new file mode 100644 (file)
index 0000000..7cf11c0
--- /dev/null
@@ -0,0 +1,22 @@
+# icu4c-tools
+
+Some haphazard tools for cross-checking results between ICU4C and Babel.
+These are not meant to be production-ready or e.g. guaranteed to not leak memory in any way.
+
+## icu4c_date_format
+
+### Compiling
+
+This worked on my macOS – on a Linux machine, you shouldn't need the `PKG_CONFIG_PATH` environment variable.
+
+```
+env PKG_CONFIG_PATH="/opt/homebrew/opt/icu4c@76/lib/pkgconfig" make bin/icu4c_date_format
+```
+
+### Running
+
+E.g.
+
+```
+env TEST_TIMEZONES=Pacific/Honolulu TEST_LOCALES=en_US,en,en_GB TEST_TIME_FORMAT="YYYY-MM-dd H:mm zz" bin/icu4c_date_format
+```
diff --git a/misc/icu4c-tools/icu4c_date_format.cpp b/misc/icu4c-tools/icu4c_date_format.cpp
new file mode 100644 (file)
index 0000000..8a6ac28
--- /dev/null
@@ -0,0 +1,101 @@
+#include <iostream>
+#include <sstream>
+#include <unicode/smpdtfmt.h>
+#include <unicode/timezone.h>
+
+static std::vector<std::string> split(const std::string &s, char delimiter) {
+  std::vector<std::string> tokens;
+  std::string token;
+  std::istringstream tokenStream(s);
+  while (std::getline(tokenStream, token, delimiter)) {
+    tokens.push_back(token);
+  }
+  return tokens;
+}
+
+static UDate parse_time_str(const char *time_str) {
+  UErrorCode status = U_ZERO_ERROR;
+  icu::UnicodeString fauxISO8601("yyyy-MM-dd'T'hh:mm:ss'Z'");
+  auto fmt = new icu::SimpleDateFormat(fauxISO8601, status);
+  fmt->setTimeZone(*icu::TimeZone::getGMT());
+  UDate date = fmt->parse(icu::UnicodeString(time_str), status);
+  if (U_FAILURE(status)) {
+    std::cerr << "Failed to parse time string: " << time_str << std::endl;
+    exit(1);
+  }
+  return date;
+}
+
+static std::vector<icu::Locale> parse_locales(const char *locales_str) {
+  auto locales = std::vector<icu::Locale>{};
+  for (auto token : split(locales_str, ',')) {
+    auto loc = icu::Locale(token.c_str());
+    if (loc.isBogus()) {
+      std::cerr << "Invalid locale: " << token << std::endl;
+      exit(1);
+    }
+    locales.push_back(loc);
+  }
+  return locales;
+}
+
+static std::vector<icu::TimeZone *> parse_timezones(const char *timezones_str) {
+  auto timezones = std::vector<icu::TimeZone *>{};
+  for (auto token : split(timezones_str, ',')) {
+    auto tz = icu::TimeZone::createTimeZone(token.c_str());
+    if (tz == nullptr) {
+      std::cerr << "Invalid timezone: " << token << std::endl;
+      exit(1);
+    }
+    timezones.push_back(tz);
+  }
+  return timezones;
+}
+
+int main() {
+  UErrorCode status = U_ZERO_ERROR;
+  const char *timezones_str = getenv("TEST_TIMEZONES");
+  const char *locales_str = getenv("TEST_LOCALES");
+  const char *time_str = getenv("TEST_TIME");
+  const char *time_format_str = getenv("TEST_TIME_FORMAT");
+
+  if (!timezones_str || !locales_str) {
+    std::cerr << "Please set TEST_TIMEZONES, TEST_LOCALES environment variables"
+              << std::endl;
+    return 1;
+  }
+
+  if (time_str == nullptr) {
+    time_str = "2025-03-04T13:53:00Z";
+    std::cerr << "Defaulting TEST_TIME to " << time_str << std::endl;
+  }
+
+  if (time_format_str == nullptr) {
+    time_format_str = "z:zz:zzz:zzzz";
+    std::cerr << "Defaulting TEST_TIME_FORMAT to " << time_format_str
+              << std::endl;
+  }
+
+  auto date = parse_time_str(time_str);
+  auto timezones = parse_timezones(timezones_str);
+  auto locales = parse_locales(locales_str);
+
+  for (auto tz : timezones) {
+    icu::UnicodeString tzid;
+    tz->getID(tzid);
+    std::string tzid_str;
+    tzid.toUTF8String(tzid_str);
+    for (auto loc : locales) {
+      auto fmt = new icu::SimpleDateFormat(time_format_str, loc, status);
+      fmt->setTimeZone(*tz);
+      icu::UnicodeString name;
+      fmt->format(date, name);
+      std::string result;
+      name.toUTF8String(result);
+      std::cout << tzid_str << "\t" << loc.getName() << "\t" << result
+                << std::endl;
+      delete fmt;
+    }
+  }
+  return 0;
+}