Hirdetés

Keresés

Új hozzászólás Aktív témák

  • Taci

    addikt

    válasz sztanozs #20530 üzenetére

    Ezzel a collation-dologgal most bekavarodtam.

    Nézegetem, hogy mit kellene használni, és ezt a linket találtam:
    http://mysql.rjweb.org/utf8mb4_collations.html

    Itt kapásból néztem a két magyart:
    utf8mb4_hu_0900_ai_ci
    utf8mb4_hungarian_ci

    De már az első karaktereknél látszik, hogy pl. A-betűnek kezeli az á-t is, és kb. minden hasonlót:
    A=a=ª=À=Á=Â=Ã=Ä=Å=à=á=â=ã=ä=å=Ā=ā=Ă=ă=Ą=ą

    Plusz ugye mert _ci, case insensitive, tehát nem különbözteti meg a kis- és nagybetűket.

    Tehát nekem a magyar-specifikus collation-ök nem jók. Ahogy nézem, ez lehet jó, hogy külön kezelje az ékezetes betűket:
    latin1_general_ci

    Itt külön van kezelve az "A" az "Á"-tól, bár jobban örülnék, ha ezeket együtt kezelné:
    À=à Á=á
    Mert simán kinézem, hogy néhány helyen még rosszul szerepelnek az ékezetek, így ezt sajnos külön kezeli, és ha a cikkben "àlom" van, a keresés az "álomra" (fordítva áll az ékezet) nem hoz majd eredményt. De ez legyen a legkisebb probléma, ezzel még együtt tudok élni.

    Jól látom, hogy a latin1_general_ci-t kell használnom, ha meg akarom különböztetni a keresést ékezetes karakterek alapján?

    Azt nem igazán találom, hogy az utf8mb4_bin hogyan működik ezekhez képest.

    ----------

    Ez a COLLATE parancsot amúgy jól használom? Vagy az adatbázis létrehozásakor kellett volna?
    Mert ilyet is találtam:
    CREATE DATABASE Jira CHARACTER SET utf8mb4 COLLATE utf8mb4_bin;

    Én igazából "csak" keresni szeretnék, az ékezetes betűket külön kezelve.
    De most ezzel eléggé bekavarodtam.

    Tereljetek irányba, kérlek.

    Köszi.

Új hozzászólás Aktív témák