Programozás topic - PROHARDVER! Hozzászólások

Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

LOGOUT témák

Téma összefoglaló

Utoljára frissítve: 2023-12-13 06:18

PROHARDVER!

Új hozzászólás Aktív témák

#6425 modder aktív tag Jim-Y #6424

Új Válasz 2012-12-29 12:44:08 #6425
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

modder

aktív tag

válasz Jim-Y #6424 üzenetére

Szuper!
Még a hibát is kijavítottad, amit a kiíratásban DIREKT rejtettem el
#6424 Jim-Y veterán modder #6423

Új Válasz 2012-12-29 12:06:32 #6424
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz modder #6423 üzenetére

Ez kemény, átírtam a scriptet az alapján amit linkeltél:
$loc = get-location $files = get-childitem -Path $loc -Recurse | where {$_.Length -gt 0} $length = $files.length $fileMap = @{} $duplicates = @() for($i=0;$i -lt $length;++$i){ $file = $files[$i] $key = $file.Name +" "+ $file.Length +"byte" if($fileMap.ContainsKey($key)){ $fileMap[$key] += $file.FullName } else { $fileMap[$key] = @($file.FullName) } } foreach ($item in $fileMap.GetEnumerator()) { if($item.Value.Length -gt 1){ $duplicates += $item.Name+":" $duplicates += $item.Value $duplicates += "`n" } } $duplicates > fileMap.txt
Ami eddig 45 percig futott most 15 mp volt
Ami eddig 22 mp volt az most 460 ms
Még leellenőrzöm, hogy ugyanazt az eredményt adja-e, de ránézésre igen
#6423 modder aktív tag Jim-Y #6421

Új Válasz 2012-12-28 23:51:32 #6423
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

modder

aktív tag

válasz Jim-Y #6421 üzenetére

Én valami ilyesmit próbálnék, nem ellenőriztem, hogy működik-e, de kíváncsi lennék mennyit fut
A $fileMap egy asszociatív tömb lesz, aminek az elemei listák az ugyanolyan nevű és méretű fájlok elérési útjáról. A végén csak azokat íratom ki, ahol ennek a listának a mérete nagyobb, mint 1, mert az azt jelenti, hogy több elérési út is tartozott ugyanahhoz a névhez és mérethez, tehát duplikált a fájl.
$loc = get-location $files = get-childitem -Path $loc -Recurse | where {$_.Length -gt 0} $length = $files.length $fileMap = @{} for($i=0;$i -lt $length;++$i){ $file = $files[$i] $key = $file.Name + $file.Length if($fileMap.ContainsKey($key)){ $fileMap[$key] += file.FullName } else { $fileMap[$key] = @(file.FullName) } } foreach($duplicates in $fileMap.GetEnumerator()){ if($duplicates.length > 1){ Write-Host $duplicates.Name ( $duplicates.Value ) } } $fileMap > fileMap.txt
#6422 Jim Tonic nagyúr Jim-Y #6419

Új Válasz 2012-12-28 22:40:05 #6422
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim Tonic

nagyúr

válasz Jim-Y #6419 üzenetére

Village People - YMCA.mp3
Majd írd meg, mennyi így a futási idő! Töredékének kellene lennie.
#6421 Jim-Y veterán Karma #6420

Új Válasz 2012-12-28 21:23:13 #6421
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Karma #6420 üzenetére

wow, ön nyert köszi^^
#6420 Karma félisten Jim-Y #6419

Új Válasz 2012-12-28 21:19:42 #6420
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Karma

félisten

válasz Jim-Y #6419 üzenetére

Ez lehet azért van, mert a $() tömböt hoz létre.
Próbáld meg kapcsos zárójelekkel ${}
#6419 Jim-Y veterán Jim Tonic #6418

Új Válasz 2012-12-28 20:49:51 #6419
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Jim Tonic #6418 üzenetére

Hát, pedig ezt írja ki:
Array assignment to [Village People - YMC ...] failed: Cannot convert value "Village People - YMCA.mp3" to type "System
.Int32". Error: "Nem megfelelő a bemeneti karakterlánc formátuma.".
At E:\_ATTILA\SCRIPTS\checkMusic.ps1:8 char:13
+ $multiples[ <<<< $key] = $value
+ CategoryInfo : InvalidOperation: (E:\_ATTILA\70\Village People - YMCA.mp3SObject) [], RuntimeExceptio
n
+ FullyQualifiedErrorId : ArrayAssignmentFailed
kód:
$multiples = @() foreach($elem in $files){ $key = $elem.Name.toString() $value = $elem $multiples[$key] = $value }
#6418 Jim Tonic nagyúr Jim-Y #6417

Új Válasz 2012-12-28 20:27:57 #6418
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim Tonic

nagyúr

válasz Jim-Y #6417 üzenetére

Nem értem. Azaz értem, de valami nem kóser.
A Hash table is also known as a dictionary. It is an array that allows you to store data in a “key-value” pair association. The “key” and “value” entries can be any data type and length. [link]
#6417 Jim-Y veterán Jim Tonic #6416

Új Válasz 2012-12-28 18:55:03 #6417
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Jim Tonic #6416 üzenetére

Mert mindenképp Int32-t szeretne kulcsnak
Példa:
$files = get-childitem ... //fájlok beolvasása $hashTable = @() //hashtable inicializálás foreach($hash in $files){ //ezek közül egy se működött valamiért:( $hashTable.$hash.Name = $hash $hashTable[$hash.Name] = $hash $hashTable["$hash.Name"] = $hash $hashTable += {name=$hash.Name,value=$hash} }
több ötletem így hirtelen nem volt :/
#6416 Jim Tonic nagyúr Jim-Y #6414

Új Válasz 2012-12-28 18:19:29 #6416
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim Tonic

nagyúr

válasz Jim-Y #6414 üzenetére

Uppsz, most nézem, hogy a hash-t próbáltad. Pedig ez jelenti a problémát.
Miért nem engedi beállítani kulcsnak a fájlnevet?
#6415 Jim Tonic nagyúr Jim-Y #6404

Új Válasz 2012-12-28 18:07:21 #6415
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim Tonic

nagyúr

válasz Jim-Y #6404 üzenetére

Non-indexed keresés mindig ennyire lassú volt. Tömb helyett mindenképpen hash táblát használnék. Ezen felül én nem olvastatnám be az egész listát előre, hanem már beolvasáskor ellenőriztetném, hogy szerepel-e az aktuális táblában.
#6414 Jim-Y veterán Karma #6413

Új Válasz 2012-12-28 15:26:26 #6414
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Karma #6413 üzenetére

Közben próbálkoztam 1-2 dologgal
1: az eredeti
$loc = get-location $files = get-childitem -Path $loc -Recurse | where {$_.Length -gt 0} $length = $files.length $multiples = @() $rows = 0 $groups = 0 [int]$10n = $length*0.1 [int]$20n = $length*0.2 [int]$30n = $length*0.3 [int]$40n = $length*0.4 [int]$50n = $length*0.5 [int]$60n = $length*0.6 [int]$70n = $length*0.7 [int]$80n = $length*0.8 [int]$90n = $length*0.9 [int]$100n = $length for($i=0;$i -lt $length;++$i){ $ismultiple = 0 $tempi = $files[$i] switch($i) { $10n { write-host "10%" } $20n { write-host "20%" } $30n { write-host "30%" } $40n { write-host "40%" } $50n { write-host "50%" } $60n { write-host "60%" } $70n { write-host "70%" } $80n { write-host "80%" } $90n { write-host "90%" } $100n { write-host "100%" } } if($multiples -contains $tempi.FullName){ } else { for($j=$i+1;$j -lt $length;++$j){ $tempj = $files[$j] if($tempj.Name -eq $tempi.Name -and $tempj.Length -eq $tempi.Length){ $multiples += $tempj.FullName $rows++ $ismultiple = 1 } } if($ismultiple){ $multiples += $tempi.FullName $rows++ $groups++ $multiples += "`n" } } } $multiples += "$loc folder has $length files, there are $groups files multiplied,`n and you could delete $($rows-$groups) files from the $rows multiplications!" $multiples > multiples.txt
Ez a tesztmappán ~21-22mp-ig futott
2: nem tömbbe írós, hanem fileba:
Ebben a verzióban a $multiples tömb helyett amit a végén fájlba írok, egy fájlhozz appendelem szekvenciálisan a dolgokat
$multiples = @() -> New-Item multiples.txt -type file -force
$multiples += $files[$j].FullName ->
Add-Content multiples.txt -value $files[$j].FullName
stb..
Ez a tesztmappán 1-2mp-el futott hosszabb ideig mint az első
3: hashmap
Sajnos nem sikerült olyan sszociatív tömböt csinálnom ahol a key-nek megette volna a fájl nevét Így egy .NET-es ArrayList-el próbálkoztam. Sajnos ez fut legtovább, a tesztmappán olyan 24mp-ig..
$loc = get-location $hashTable = New-Object System.Collections.ArrayList(,(get-childitem -Path $loc -Recurse | where {$_.Length -gt 0})) $duplications = New-Object System.Collections.ArrayList($null) $rows = 0 $groups = 0 $length = $hashTable.Count for($i=0;$i -lt $length;++$i){ $ism = 0 if($duplications.Contains($hashTable.Item($i).FullName)){ } else { $temp = $hashTable.Item($i) for($j=$i+1;$j -lt $length;++$j){ $tempj = $hashTable.Item($j) if($tempj.Name -eq $temp.Name -and $tempj.Length -eq $temp.Length){ $duplications.Add($tempj.FullName) $rows++ $ism = 1 } } if($ism) { $rows++ $groups++ $duplications.Add($temp.FullName) $duplications.Add("`n") } } } Write-Host "$length files, there are $groups files multiplied,`n and you could delete $($rows-$groups) files from the $rows multiplications!" $duplications > multiples.txt
Most véletlenül az egész partíció gyökerére futtattam le az első verziót, 10perc alatt csinált meg 10%-ot
#6413 Karma félisten Jim-Y #6412

Új Válasz 2012-12-28 15:15:14 #6413
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Karma

félisten

válasz Jim-Y #6412 üzenetére

Én sajnos nem eléggé, pedig ez most érdekes probléma
Találtam a PowerShellben egy tök hasznos funkciót: measure-command.
Ezzel pontosan ki tudod mérni, mi mennyi idő.
#6412 Jim-Y veterán Sk8erPeter #6411

Új Válasz 2012-12-28 11:52:34 #6412
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Sk8erPeter #6411 üzenetére

Nagyon ráérek, és ahogy ez lenni szokott, persze nem tanulással töltöm a feles időt
Ezzel kezdtem, így jutottam el a lentiig.
#6411 Sk8erPeter nagyúr Jim-Y #6410

Új Válasz 2012-12-28 11:48:08 #6411
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Sk8erPeter

nagyúr

válasz Jim-Y #6410 üzenetére

Amúgy csak kíváncsiságból, hogyhogy ezt pont PowerShellben csinálod? Gyakorlásként?
Nem igazán nyomattam még PowerShell-scriptírogatást, elsőre kicsit furcsa a szintaktikája, bár biztos megszokható.
#6410 Jim-Y veterán Karma #6409

Új Válasz 2012-12-28 11:44:12 #6410
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Karma #6409 üzenetére

Magát a tömböt összeírni alig pár másodperc, nem az a hosszú, hanem ami a for ciklusban van, csináltam egy olyan kiiratást ami 10 százalékonként kiír a képernyőre, bár ez nem mutatja meg, hogy ténylegesen mi a sok idő...
Ami ötletem még van, az az, hogy ha egy fájlhoz összeszedi a duplikációkat, akkor azokat kitörli a tömbből, így a következő vizsgálandó fájlnál már annyival kevesebb elemet kell végignézni, bár ha kevés a duplikáció a mappában, akkor ez szinte semmit nem segítene. A másik ötletem, hogy az is lassú lehet amikor valamit hozzáadok a $multiples tömbhöz, mert elméletileg ilyenkor mindig készít egy másolatot az aktuális tömbről, legalábbis valami ilyesmit olvastam a neten, tehát lehet ezt a tömbhöz hozzáadok dolgot ki kéne cserélni valamire, például arra, hogy már az elején hozzon létre egy fájlt, majd utána csak appendoljon hozzá, hátha így gyorsabb lesz... majd mindjárt kipróbálom.
#6409 Karma félisten Karma #6408

Új Válasz 2012-12-28 11:06:41 #6409
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Karma

félisten

válasz Karma #6408 üzenetére

Bár jó lenne tudni, hogy a tömb összegyűjtése lassú, vagy maga a tényleges pároztatás. Simán lehet az előbbi - azért ennyi elem nem sok egy tömbben -, biztosat csak mérni lehetne, néhány jól irányzott kiírással pl.
#6408 Karma félisten martonx #6407

Új Válasz 2012-12-28 10:51:19 #6408
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Karma

félisten

válasz martonx #6407 üzenetére

Párhuzamos foreachre találtam valamit, szóval biztosan meg lehet kovácsolni.
De nem hiszem, hogy egy kétszeres szorzó megoldás lenne a négyzetes (vagy rosszabb, nem voltam jó algelből) algoritmusra. Oké, ötezer fájlt lenyom gyorsabban, tízezernél meg kezdődik elölről a tánc...
#6407 martonx veterán Jim-Y #6404

Új Válasz 2012-12-28 08:14:15 #6407
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

martonx

veterán

válasz Jim-Y #6404 üzenetére

Szia!
Nem tudom powershell mennyire támogatja a párhuzamosságot, de mondjuk C#-ra átírva szépen és lazán ki tudod használni az összes processzormagot a gépben. Azaz a 2-3 perc futásidő, 2 magos gép esetében akár 1 percre is lemehet. Persze kérdés, hogy mennyi idő megy el a filerendszer használatával, mert azon a több mag nem segít.
#6406 modder aktív tag Jim-Y #6404

Új Válasz 2012-12-28 02:17:18 #6406
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

modder

aktív tag

válasz Jim-Y #6404 üzenetére

if($multiples -contains $files[$i].Name){ } -- Ahogy nő a $multiples tömb, egyre inkább több időt fog tölteni azzal, hogy a fájlnevet megtalálja benne, mert a -contains végignézi az egész tömböt. A duplikált fájlnevek tárolására használj inkább asszociatív tömböt, mert azt fájlnév szerint lehet címezni, és a szervezése Hash táblaszerű, tehát gyorsabb benne név alapján megtalálni egy elemet.
http://powershell.com/cs/blogs/tips/archive/2009/09/09/checking-whether-hash-table-contains-key.aspx
for($j=$i+1;$j -lt $length;++$j){ if($files[$j].Name -eq $elem.Name -and $files[$j].Length -eq $elem.Length){ $multiples += $files[$j].FullName $ismultiple = 1 } }
-- Itt a belső ciklusban szintén szekvenciálisan keresel végig a fájlnevek listáján, aminél átlagos keresési idő n/2. Jobb eredményt érsz el, ha először a fájlnevek listáját rendezed név szerint növekvő sorrendben, és egy ismert egyszerű kereső algoritmust használsz rá, pl. bináris keresés. Nem tudom, hogy erre van-e beépített szolgáltatása a Powershellnek, de lehet valaki már írt rá kódot a neten.
Mivel gondolom egy egyszeri feladat volt, ezért már nem fogsz vele vacakolni, de van helye a fejlődésnek
#6405 Jim-Y veterán Jim-Y #6404

Új Válasz 2012-12-28 01:03:13 #6405
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

válasz Jim-Y #6404 üzenetére

Én:
E:\Én folder has 1469 files, there are 55 files multiplied,
and you could delete 63 files from the 118 multiplications!
Muter:
E:\Ő folder has 5574 files, there are 1160 files multiplied,
and you could delete 1196 files from the 2356 multiplications!
haha
#6404 Jim-Y veterán

Új Válasz 2012-12-28 00:34:39 #6404
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jim-Y

veterán

Sziasztok
PowerShellben csináltam egy olyan scriptet ami egy directoryban rekurzívan megnézi a duplikációkat, és a duplikált állományok nevét kigyűjti egy fájlba.
A problémám az, hogy az algoritmus amit használtam/írtam nagyon lassú. Ha ~2000 fájlt kell összehasonlítania az még viszonylag gyors 10,15mp, de 5500 állománnyal már percek óta szöszöl :S
megj: közben 2-3 perc múlva végzett
Az ilyen rekurzív összehasonlítgatós dolgokat hogyan lenne célszerű megoldani?
Jelenleg a kódom:
$loc = get-location $files = get-childitem -Path $loc -Recurse | where {$_.Length -gt 0} $length = $files.length $multiples = @() for($i=0;$i -lt $length;++$i){ $ismultiple = 0 if($multiples -contains $files[$i].Name){ } else { $elem = $files[$i] for($j=$i+1;$j -lt $length;++$j){ if($files[$j].Name -eq $elem.Name -and $files[$j].Length -eq $elem.Length){ $multiples += $files[$j].FullName $ismultiple = 1 } } if($ismultiple){ $multiples += $elem.FullName $multiples += "`r`n`r`n" } } } $multiples > multiples.txt
Látható, hogy először kigyűjtöm a fájlneveket egy tömbbe, majd az első rekordot keresem a fennmaradó elemek között, ha van duplikáció, akkor kiírom azokat a fájlba, és ugrok a második elemre.
Szinte biztos vagyok benne, hogy van ennél hatásosabb módszer, de már túl késő van ahhoz, hogy rájöjjek, hogy mi az
megj: haha, lehet csak azért szöszölt annyit, mert muter fél mappája duplikált, egy rahedli duplikációja van