Add test_region_is_known

author Denis Moyogo Jacquerye <moyogo@gmail.com>

Thu, 24 Aug 2023 14:15:45 +0000 (16:15 +0200)

committer Denis Moyogo Jacquerye <moyogo@gmail.com>

Fri, 22 Sep 2023 20:38:20 +0000 (22:38 +0200)
author Denis Moyogo Jacquerye <moyogo@gmail.com>
Thu, 24 Aug 2023 14:15:45 +0000 (16:15 +0200)
committer Denis Moyogo Jacquerye <moyogo@gmail.com>
Fri, 22 Sep 2023 20:38:20 +0000 (22:38 +0200)
diff --git a/tests/test_data_languages.py b/tests/test_data_languages.py

index 100821af6a69361b4eb07472a5c0e424af6e4010..855cbee76478c3b0490150807b7b2e4197b255c3 100644 (file)
--- a/tests/test_data_languages.py
+++ b/tests/test_data_languages.py
@@ -18,13 +18,14 @@ from collections import defaultdict, Counter
  import re
  import unicodedata
  
-from gflanguages import LoadLanguages, languages_public_pb2, LoadScripts
+from gflanguages import LoadLanguages, languages_public_pb2, LoadScripts, LoadRegions
  import pytest
  import youseedee
  
  
  LANGUAGES = LoadLanguages()
  SCRIPTS = LoadScripts()
+REGIONS = LoadRegions()
  
  CLDR_SCRIPT_TO_UCD_SCRIPT = {
      "Bangla": "Bengali",
@@ -45,6 +46,17 @@ SKIP_EXEMPLARS = {
      "thp_Latn": "Does indeed use Greek glyphs while writing Latin",
  }
  
+SKIP_REGION = {
+    "cpf_Latn": "French-based creole languages is a group of languages.",
+    "gem_Latn": "Germanic languages is a group of languages.",
+    "sla_Latn": "Slavic languages is a group of languages.",
+    "hmn_Latn": "Homnic languages is a group of languages.",
+    "ie_Latn": "Interlingue is an artifical language.",
+    "io_Latn": "Ido is an artifical language.",
+    "jbo_Latn": "Lobjan is an artifical language.",
+    "tlh_Latn": "Klingon is an artifical language.",
+}
+
  
  @pytest.mark.parametrize("lang_code", LANGUAGES)
  @pytest.mark.parametrize(
@@ -119,6 +131,17 @@ def test_script_is_known(lang_code):
      assert script in SCRIPTS, f"{lang_code} used unknown script {lang.script}"
  
  
+@pytest.mark.parametrize("lang_code", LANGUAGES)
+def test_region_is_known(lang_code):
+    lang = LANGUAGES[lang_code]
+    if lang.id in SKIP_REGION:
+        pytest.skip(SKIP_REGION[lang.id])
+        return
+    regions = lang.region
+    for region in regions:
+        assert region in REGIONS.keys()
+
+
  @pytest.mark.parametrize("lang_code", LANGUAGES.keys())
  def test_exemplars_are_in_script(lang_code):
      lang = LANGUAGES[lang_code]
author	Denis Moyogo Jacquerye <moyogo@gmail.com>
	Thu, 24 Aug 2023 14:15:45 +0000 (16:15 +0200)
committer	Denis Moyogo Jacquerye <moyogo@gmail.com>
	Fri, 22 Sep 2023 20:38:20 +0000 (22:38 +0200)