Hirdetés
- Az Enermax nagyon belehúzott a "tápozásba"
- Pendrive irás-olvasás sebesség
- Nem a képgenerálásnak van köze a képmegjelenítés egyenletességéhez
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Ventilátorok - Ház, CPU (borda, radiátor), VGA
- Kormányok / autós szimulátorok topikja
- Na, milyen hardver kerül a fa alá?
- Épített vízhűtés (nem kompakt) topic
- Projektor topic
- VR topik
-
PROHARDVER!

Új hozzászólás Aktív témák
-
Domonkos
addikt
-
válasz
total90
#12618
üzenetére
Név Utca Házszám Irányítószám Város
Igazabol ahogy felettem is irtak, a nev meg az utca kb eselytelen, hacsak nem talalsz egy olyan adatbazist, amiben minden varos minden utcaja szerepel, de meg ugy se 100%, bar ugy mar szerintem egy laza 90%-os szures megoldhato lenne.
Amugy az en algo-m ugy nezne ki, hogy jobbrol balra indulunk, igy nezve elso szam utani karaktersor a varos.
Marad az, hogy Név Utca Házszám Irányítószám.
Most balrol jobbra haladva elso szam utani ertek a Házszám Irányítószám.
Iranyitoszam minden esetben 4 karakter, igy az konnyu.
Maradt a Nev es az Utca.
Nevnel a fentebb emlitett ket nev, egy szokoz kombora losz, az a valosag ~90%-at lefedi.
Marad az utca, mint adott.De a nev - utca parost mindenkeppen le kell ellenorizned biorobot modszerrel.
-
Zalanius
tag
válasz
total90
#12618
üzenetére
"Név Utca Házszám Irányítószám Város"
Az eredeti kérdésben is írtad: a probléma az elválasztó karakter, ami ugyanolyan szóköz, amilyenből kis túlzással tetszőleges mennyiség előfordulhat a név, utca, város esetében mezőn belül is. Exceles eszközökkel stabil megoldás erre aligha lesz, még makrókkal sem, legfeljebb egy valamilyen közelítés. Itt az adatmennyiség a kulcs: pár száz sorig egyszerűen nem éri meg bonyolult szabályrendszereket kódolgatni, a humán erőforrás előbb végez. Ha valami nagyságrendekkel nagyobb listáról van szó, értékes adatokkal, amiből ez a katyvasz áll rendelkezésre, akkor meg a teljes folyamat defektes úgy, ahogy van...
Klasszikus adattisztítós / feltáró feladatként úgy ugranék neki, hogy ha nemzetköziek is a címek, azért a vonatkozó országok városainak (talán) teljes listája beszerezhető, ezért az azonosítás könnyű, ugyanígy az irányítószámok szerkezetére vonatkozó helyi szabályok. Utóbbi nyilván számokat is tartalmaz, ezért az utolsó ilyen töredék után már csak a városnevek lehetnek, a házszám szintén kell, hogy számokat tartalmazzon stb. Nyilván a név-utca felbontás a legtrükkösebb, pl. "Horváth Péter Mátyás Király tér".
De nem feltétlen kell ágyúval lőni az ilyen szóközös verébre. Vegyél egy pár soros mintát, nézd meg a tipikus szerkezetet. Ha van valami többségi mintázat, akkor legyen az a fő szabály, és a többit meg nézd át egyenként. Példa: szóközök mentén felbontva (Excelben: szövegből oszlopok) tipikusan 2 mező a név, 2 az utca, 1 a házszám, 1 az irányítószám, 1 a város. Ha az adott sor 7 mező széles, kész vagyunk, minden más esetet meg ki kell szűrni és átnézni. Nyilván a neveknél a prefix, mint Mr., Dr., Özv. stb. a fő veszély, a házszámoknál a külön írt /a vagy 4. em. 15., de ezekre fel lehet készülni.
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- HIBÁTLAN iPhone 13 Pro 128GB Graphite -1 ÉV GARANCIA - Kártyafüggetlen, MS3747, 100% Akkumulátor
- Keresek Galaxy S21/S21+/S21 Ultra/S21 FE
- AKCIÓ! HP EliteBook x360 830 G7 i5-10210U 16GB 512GB 1 év garancia
- Zebra ZP505 EPL hőpapíros címkenyomtató
- GYÖNYÖRŰ iPhone 15 Pro Max 256GB Blue -1 ÉV GARANCIA - Kártyafüggetlen, MS3943, 100% Akkumulátor
Állásajánlatok
Cég: Laptopszaki Kft.
Város: Budapest
Cég: BroadBit Hungary Kft.
Város: Budakeszi




