4 min czytania

Amazon backend keywords — 250 bajtów, nie znaków (Unicode trap)

Amazon backend search terms mają limit 250 BAJTÓW, nie znaków. Niemieckie ä/ü, polskie ą/ę zjadają po 2 bajty. Jak liczyć i nie spaść poniżej limitu.

#Backend#Amazon#Unicode

Pułapka: bajty ≠ znaki

Amazon backend search terms mają limit 250 bajtów, nie 250 znaków. Większość sprzedawców tego nie wie i albo marnuje miejsce, albo listing jest odrzucany.

Matematyka UTF-8

W UTF-8:

  • a-z, 0-9, spacja → 1 bajt
  • ä, ö, ü, ß, é, ñ → 2 bajty
  • 日, 中, ł → 3 bajty (w niektórych znakach)

Przykład dla rynku DE

String: "bio spirulina tabletten naturlich" — 32 znaki, 32 bajty. OK.

String: "bio spirulina tabletten natürlich" — 33 znaki, 34 bajty (ü = 2 bajty). Wciąż OK.

Ale weź 125 słów niemieckich z umlautami — łatwo przekroczysz 250 bajtów mając tylko 230 znaków.

Jak policzyć w Pythonie

text = "bio spirulina tabletten natürlich"
len(text)  # 33 (znaki)
len(text.encode("utf-8"))  # 34 (bajty)

Jak policzyć w JavaScript

new TextEncoder().encode(text).length  // 34

Nasze narzędzie robi to za Ciebie

Wrzuć CSV + zrób compliance check — narzędzie policzy bajty automatycznie dla dowolnego rynku (US/DE/FR/ES/IT/JP/PL...).