Hirdetés
- Vezetékes FEJhallgatók
- Milyen billentyűzetet vegyek?
- Épített vízhűtés (nem kompakt) topic
- Bluetooth hangszórók
- Milyen TV-t vegyek?
- Kormányok / autós szimulátorok topikja
- Billentyűzet-választó: mechanikus vs membrános – kinek melyik a jobb?
- Projektor topic
- Házimozi belépő szinten
- Lopakodva befutott a Radeon RX 9060
-
PROHARDVER!

Új hozzászólás Aktív témák
-
#05216000
törölt tag
válasz
ngabor2
#12353
üzenetére
Ha még kell segítség és itt nem kapsz, akkor küldj e-mailt a victorsugo@protonmail.com címre. Innen most kiszálltam.
(kinek volt az az idióta ötlete, hogy egy témához több hozzászólást nem lehet írni, míg valaki más nem ír? Ez valami hihetetlenül retardált megoldás, bármi is legyen az oka) -
#05216000
törölt tag
válasz
ngabor2
#12351
üzenetére
Azt hiszem, félreértesz. Az a baj, hogy a szinonima hivatkozása az eredetire nem konzisztens.
Bocs, csak példa, de nem tudom másképp:
Ha lenne egy "Dendrobium Orchidea" nevű növényed, aminek van ezer szinonimája, de a szinonimák hivatkozásaiban hol "Dendrobium Orchidea" van, hol "Dend. Orcihd.", máskor meg "Dendrobium O." akkor automatikusan, a mi eszközeinkkel, ezt nem lehet összepárosítani.
És eredetiként csak az egyik verzió szerepel.Normál körülmények közt csak annyi lenne a feladvány, hogy kiválogatod a neveket, amikre később szinonimák is vannak, majd a szinonima - eredeti párosokat kettéválasztani, field separator "-", kiírod fordított sorrendben, sorba rendezed és talán erre kell egy kis program, ami json-ra konvertálja az egészet.
cat *.htm | gawk 'BEGIN { FS="-" } /<P>~/{ a=$1; b=$2; sub("<P>~[ ]*","",a); sub("^[ ]*See[ ]*","",b); print b,"\t",a}'| sortEz kilistázza a szinonima - eredeti párokat úgy, hogy előre veszi az eredetit, mögé TAB karakterrel elválasztva a szinonimát. A /<P>~/ helyére kellene egy pontos minta a szinonimákat tartalmazó sorokhoz, amit nem sikerült megtalálnom, mert valami mindig kimaradt vagy épp olyan sorokat is felszedett, amik nem feleltek meg a követelményeknek.
Ennek a sort előtti kimenetét kellene összefésülni az eredetiket tartalmazó listákkal és összefűzni az azonos növényhez tartozó sorokat, majd az egészből json-t készíteni.
De nálam ez teli van szeméttel. -
#05216000
törölt tag
válasz
ngabor2
#12348
üzenetére
Keress rá erre: "Ascocentrum ampullaceum"
Nekem úgy tűnik, kénytelen leszel minden frissítésnél újra és újra átbogarászni a letöltött adatok tartalmát, mert csak ennél minimum kétféle elnevezést találtam, látszólag ugyanahhoz a növényhez. Kétféle alatt azt értem, hogy az egyik verzióban teljesen ki van írva a Lindley, a másikban Lindl. szerepel. És ilyenekből van bőven. Ahogy olyanból is, hogy <P>~ karakterekkel indul a sor, de mögötte nem elnevezés van, hanem egy <a href...> tag és csak az.Vagy az ilyen eltérések, hiányosságok még beleférnek?
Meg az is eszembe jutott, hogy ez legális egyáltalán? Úgy értem: szerzői jogokat nem sért ez a feldolgozás?
-
#05216000
törölt tag
válasz
ngabor2
#12346
üzenetére
Néhányszor nekifutottam, de olyan gányolmány az egész oldal, hogy ennek a feldolgozásához jó érzésű ember nem ír programot.

Mást ne mondjak: címlap lejön valami win-12xx kódolással, az aloldalak meg iso-8859-1-nek mondják magukat. (a címlapról úgy látom, lemaradt az encoding a fejlécből)Szóval erre programot írni szerintem nem sok értelme van. Amit én tennék, megpróbálnám manuálisan, szövegfeldolgozó programok segítségével kibányászni a szükséges infókat és abból előállítani a szükséges json formátumot. Túl sok programozással nem jár, a regex használat elég lehet a többséghez.
Az elindulásban tudok segíteni, ha gondolod.
-
-
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- GYÖNYÖRŰ iPhone 14 Pro Max 256GB Space Black-1 ÉV GARANCIA - Kártyafüggetlen, MS4143
- HIBÁTLAN iPhone 12 mini 64GB Red -1 ÉV GARANCIA - Kártyafüggetlen, MS2036
- Xiaomi 15 256GB, Kártyafüggetlen, 1 Év Garanciával
- 157 - Lenovo LOQ (15ARP9) - AMD Ryzen 7 7435HS, RTX 4060 (ELKELT)
- BESZÁMÍTÁS! ASUS B560 i7 11700 32GB DDR4 512GB SSD RTX 4060Ti 16GB RAMPAGE Shiva A-Data 650W
Állásajánlatok
Cég: Laptopszaki Kft.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest





