Az első bejegyzés afféle ars poetika lesz. Lelkes hobbista szinten érdekel a programozás, a statisztika és az adatelemzés. (oké, ez utóbbi némiképpen a munkám is) Mivel mostanában egy egyre több és egyre komplexebb internetes adatok elemzésével kapcsolatos kérdés merült fel bennem, gondoltam, hogy indítok egy blogot ennek bemutatására. És titkon bízom benne, hogy mások érdeklődésére is számot tarthat. Úgy gondolom, hogy egy ilyen project afféle utazás, a kérés felvetésétől kezdve az alkalmazott módszer kiválasztásán és megvalósításán keresztül a tanulság levonásáig. Nagyon jó látni, hogy egy megfelelő ezközökkel feltett kérdés milyen mélyebben rejlő igazságokat, mechanizmusokat tud feltárni.
Az ezközökről: mivel bioinformatikai vonalról indulok, a Perl nyelv alap, ezt elég magas szinten űzöm, ezt próbálom kiegészíteni Python-nal és R-rel, amik mostanában egyre kurrensebb ezközei az adatbányászatnak és analitikának. Az adatok kiértékeléséhez vagy gnuplot vagy R vagy az Origin programcsomagot használom, de itt is egyre inkább törekszem az R és Python bevonására.
Disclaimer: nem fogom túlzottan cifrázni a dolgokat, mert nincs sok időm a meló és a gyerek mellett ezekre a hóbortokra, arra meg mégkevésbé, hogy ezt valami űberszofisztikált módon megosszam. Az szinte kizárt, hogy egy bejegyzést a publikáció előtt 2x elolvassak, így nyilván hemzsegni fog a helyesírási hibáktól (annál inkább, mert angol billentyűzeten írok és nincs magyar helyesírás ellenőrzés). Ezek engem egyátalán nem érdekelnek. Teljes scripteket valószínűleg nem fogok közzétenni, de olyan script részleteket, amik valamilyen módon kulcs szerepet játszottak egy egy probléma megoldásában, mindnképpen, és erre valamilyen szintaxis kiemelő cuccot is fogok használni, hogy értelmesebb legyen az információ.
Na, de nem pofázok tovább, csapjunk bele a lovak közé.