Arkistojen aarteita?

mpv on mplayeriin pohjautuva mediasoitin, jonka käynnistän komentoriviltä. Sen takia alaosassa kuvaa näkyy mpv:n "virheilmoitukset" tekstitysraidan vaihtoon liittyen. Samalla näkyy kaikki muutkin streamit tai mediavuot, jotka TV-kortilla tallennetussa m2t-tiedostossa ovat.

Minä olen tehnyt ikivanhoja rästitöitä tai oikeastaan olen laittanut uuden vielä testikäytössä olevat tietokoneen niitä tekemään. Minulla on vuodesta 2008 lähtien suunnilleen vuoteen 2015 asti TV-korteilla tallennettuja TV-ohjelmia noin 4,5 teratavua. Ne ovat SD-resoluutiolla vaikka osan aikaa minulla on ollut käytettävissä HD-tasoiset kaapeli-TV-kortit ja kaapeli-TV-liittymä. Toinen ongelma niissä on se, että ne ovat MPEG-2-koodauksella pakattuja, kun nykyään ja itse asiassa jo hyvin pitkään on ollut varsin yleisessä käytössä uudempi ja pienempään tilaan pakkaava MPEG-4. Jos videotiedoston tarkennin on mp4, on se melkoisella varmuudella MPEG-4-pakattu, mutta myös esimerkiksi monipuolisen ja suositun container tai kääre-formaatti Matroskan (.mkv) videostriimi on lähes poikkeuksetta MPEG-4- (tai H264-) -pakattu.

Kun MPEG-2 transkoodataan MPEG-4-formaattiin on tiedostokoko tyypillisesti vain noin 40 % alkuperäisestä. Se kuitenkin vaatii aika paljon prosessointitehoa. Minä aloitin uuden ”Chicken Blood Monster PC:n” rankemman testikäytön vähitellen jo pari viikkoa sitten, mutta koska sen tuuletusjärjestelmässä on toistaiseksi aika karkea toteutusvirhe, olen pitänyt sen yli 2 000 % laiskana, jotta toinen prosessoreista ei ylikuumenisi. Kun aitoja prosessoriytimiä siinä on 36 ja HyperThreadingin avulla säikeitä tai näennäisiä prosessoriytimiä 72, on silti jäänyt käytettäväksi lähes 5 200 %.

Chrome saattoi kääntää kiinaa englanniksi vähän hassusti. BIOS emolla on AMI BIOS eikä mikään Chicken Blood BIOS. Enkä myöskään usko, että BIOS-päivitys auttaisi vähentämään verenpainetta. Kuva on linkki täysikokoiseen.

4,5 teratavua on noin 2 250 tuntia videokuvaa ja jos oikein muistan, vuonna 2008 kasaamallani neliytimisellä tietokoneella transkoodaus olisi kestänyt suunnilleen yhtä kauan tai ainakin puolet siitä ajasta. Chicken Blood Monster PC:n kaksi Intel(R) Xeon(R) CPU E5-2696 v3 @ 2.30GHz prosessoria transkoodaa vajaakuntoisenakin noin 15-kertaisella nopeudella eli jos olisin heti osannut automatisoida työn niin, että kone olisi paahtanut yötä-päivää, olisi homma ollut valmis viikossa. Nyt siihen on mennyt noin kaksi viikkoa, mutta kyse onkin ensimmäisestä koeajosta täysin uudella laitteistolla. Lisäksi tuuletusjärjestelmä uudistuu aika perusteellisesti, kun verkkokaupoista tilatut tarvikkeet ja osat saapuvat lähiaikoina. Uudistetulla koneella homma hoituisi varmaankin jo muutamassa päivässä. Silloin aikoinaan, kun nuo TV-ohjelmat tallensin, olisi sen aikaisella parhaalla koneellani mennyt aikaa noin pari kuukautta.

Tuntipalkoille tässä hommassa ei pääse. Tulen säästämään tallennustilaa noin 2,5 teraa, jonka rajakustannusarvo on noin 50 Euroa. Olen juuri uudistanut levypalvelinjärjestelmäni, johon ostin 5-teraisia 2,5-tuumaisia Seagaten Refurbished-levyjä noin sadalla Eurolla per levy. Palvelimen kokonaishinnan ja RAID5:n pariteettilevyn jyvittämisellä hinnaksi tulisi tietysti huomattavasti korkeampi, mutta lisätila maksaa tosiaan vain 20 €/Tt ja käytetyt, mutta tehtaan tarkistamat levyt ovat juuri sopivia RAID5-pakkaan.

Artikkelikuvassa oleva Monte Criston kreivi on 1998 tehty mini-TV-sarja, jonka yhteiskesto on 6 h 40 min. ja se esitettiin alkuaan neljässä osassa, mutta YLE lähetti sen Uudenvuodenpäivänä yhteen pötköön kahdeksassa osassa. Olen aina ihmetellyt sitä, miten TV-tallenteisiin arpoutuu tiedostonimiin täysin sattumanvaraisesti suomi tai ruotsi. Tässä tapauksessa sillä olisi voinut olla se haitta, että sarjan osien järjestystä olisi hankala selvittää, jos alkuperäiset tiedostot olisivat poistettu, kun jälkikäteen tiedostonimeen lisätty päiväys on kaikissa sama. Alla järjestys tarkan aikaleiman mukaan:

$ ls -1strh *Monte* 
1,6G 2011-01-01_Monte-Criston_kreivi.m2t
1,7G 2011-01-01_Monte-Criston_kreivi-1.m2t
1,8G 2011-01-01_Monte-Criston_kreivi-2.m2t
1,8G 2011-01-01_Monte-Criston_kreivi-3.m2t
1,7G 2011-01-01_Greven_av_Monte_Cristo.m2t
1,5G 2011-01-01_Greven_av_Monte_Cristo-1.m2t
1,6G 2011-01-01_Monte-Criston_kreivi-4.m2t
1,4G 2011-01-01_Greven_av_Monte_Cristo-2.m2t
Ylen sivuilta tuskin mitään löytyisi, mutta imdb.comissa on kaikki elokuvat ja TV-sarjat. Kuva on linkki IMDb:n sivulle.

HandBrake näyttää kadottavan ”hollanninkielisen” näkörajoitteisten koneen lukeman ääniraidan transkoodauksessa Matroska-tiedostoiksi, mutta se on oikeastaan vain hyvä asia. DVD- ja varsinkin Blu-Ray-levyiltä löytyy vielä enemmän käyttökelpoista materiaalia kieltenopiskelijalle.  Eräs minun silmääni pistänyt on A Clockwork Orangen Blu-Ray-versio, jossa on ääniraidat englanniksi myös 16-bittisenä 48 kHz 6-kanavaisena häviöttömässä PCM-formaatissa, joka vie tilaa hulppeat 4,4 gigaa eli DVD-levyn verran, ranska, saksa, italia, espanja ja se normaali englanti AAC-formaatissa eli yhteensä seitsemän ääniraitaa. Tekstityksiä on 19 kpl. Kunhan saan espanjan paremmin haltuun, pitää kuunnella sen irlantilaisen juopon örinät espanjaksi sillan alla, kun Alex drugineen pahoinpitelee hänet.

Nyt kun tuo homma on jo melkein valmis, jätin CBM PC:lle vielä tuuletusjärjestelmän korjauksen jälkeiseen testaukseen vajaa 300 gigaa ja uuttakin transkoodattavaa tulee hiljaksiin, on hyvä arvioida löytyikö niistä 15 – 10 vuotta vanhoista TV-tallenteista mitään arvokasta ja vastaus on jo oikeastaan edellä annettu eli eipä juuri mitään. Joissakin Ylen kanavilta tallennetuissa on muka espanjankielinen tekstitys, mutta oikeasti ei ole. Se on kai tullut vahingossa hollannin sijaan, joka oikeasti tarkoittaa kuulorajoitteisten tekstitystä. Kaupallisten kanavien tallenteista pätkin Kdenlivellä alusta ja lopusta turhat pois ja samalla tuli tarkastettua, että ne ovat kokonaisia ja muutenkin riittävän ”ehjiä”, mutta tärkeintä oli opetella leikkaamaan mahdollisimman nopeasti ja samalla mietittyä sekä hieman kokeiltuakin klusteroinnin ja eräajojen toteutusta. Tein lähes kaiken nykyisellä Z420-työasemallani, tiedostot olivat komerossa olevalla tiedostopalvelimella ja Kdenliven tuottamat skriptit sekä HandBrake-gui:n instassit pyörivät CBM PC:llä eli yksi kone vastasi käyttöliittymästä, toinen tallennustilasta ja kolmas monistettavissa oleva laskennasta. Niiden CBM PC:n 72 prosessorisäikeen lisäksi olisin aika helpolla saanut järjestettyä 92 lisää eli yhteensä 164 kappaletta, joka olisi kai tarkoittanut noin 80-kertaista nopeutta ja koko homma olisi valmistunut noin 28 tunnissa.

Aika on kuitenkin ajanut ohi jo aikaa sitten tämän tapaisten viritysten. Olen jo vuodesta 2012 lähtien ladannut videoita Yle Areenasta yle-dl:llä ja vaikka tiedostomuodoissa on ollut aikoinaan joitakin ongelmia, on videokuva kuitenkin aina ollut hyvin tehokkaasti pakattua eikä niitä ole tarvinnut tai kannattanut mitenkään käsitellä. Lisäksi nykyään tiedostomuotona on Matroska ja kaikki mahdolliset tekstitykset ja ääniraidat ovat samassa tiedostossa. Niitä minulle on kertynyt jo 5,6 teraa, joka tarkoittaisi HD-tasoisena noin 3 300 tuntia, mutta kun vanhemmat tallenteet ovat SD-tasoisia ja vievät vähemmän levytilaa, niin eiköhän niissä olisi melkein kolmeksi vuodeksi katsottavaa normaalin täysipäiväisen työajan puitteissa.

Chicken Blood Monster PC:n tulevan tuuletusjärjestelmän komponenteista

Hardware Havenin YouTube-kanavalla oli reilu viikko sitten mielenkiintoinen video I Made My Own JBOD Enclosure For CHEAP, jonka kuvauksessa oli linkit käytettyjen komponenttien myyntisivuille Amazonissa. Etsin tuulettimien ohjaimen (Fan Controller) sivua tietysti Saksan Amazonista, mutta kun se maksoi noin kympin, tarkistin hinnan myös AliExpressissä ja tein seuraavan tilauksen:

Tilauksen summaksi piti saada yli 10 €, jotta välttyi postimaksuilta.

Sininen vempain on potentiometri, mutta samalla haulla löytyi myös muuten lähes identtinen, mutta piuhojen päässä olevalla potikalla varustettu malli ja ei kun tilaamaan:

Jälleen kymppi oli rajana postikuluttomuudelle.

Fiksumpi oli kuitenkin lämpötila-anturilla varustettu malli, jossa lämpötilojen raja-arvot asetetaan dippikytkimellä:

Hälytinpiipparia ei tarvitse liittää piirilevylle, kun se on kätevästi irrallinen.

Tuulettimissa ei ole mitään erikoista, mutta 12-senttisille sopivat filtterit ovat magneettikiinnitteisinä käteviä:

Eiköhän noista jotain rakennu.

rkoski
Salo

IT-ammattilainen ja -kirjailija. Tehnyt aikoinaan useita Linux-levitysversioita nimillä SOT, Best, Spectra ja Lineox Linux. Julkaistuja kirjoja puolisen hyllymetriä.
Yhteystiedot: www.raimokoski.fi , www.raimokoski.com , www.lineox.net , rk at raimokoski piste com, rk at lineox piste net

Ilmoita asiaton viesti

Kiitos!

Ilmoitus asiattomasta sisällöstä on vastaanotettu