Datajournalismi/Datatekniikat-opintopiiri

Wikiopistosta

Tämä sivu on tarkoitettu vapaamuotoisten vertaisopintopiirien käyttöön avoimen datan ja datajournalismin tekniikoiden ymmärtämiseksi ja soveltamiseksi omaan käyttöön. Tavoitteena ei ole termien ja asioiden esittämisen eksaktius vaan niiden esittäminen ymmärrettävästi :)

Ole hyvä ja listaa tähän aakkosjärjestykseen käsitteitä ja termejä jotka haluat oppia, lisää linkkejä, kirjoita kuvauksia tai kysymyksiä tai jäsennä koko sivun rakenne uudestaan :). Tai merkitse "haluan oppia tämän" ja jokin yhteystietosi.

Käsitteet ja termit[muokkaa]

Tämän voisi purkaa erikseen muun muassa ohjelmointikieliin listan edetessä.

API[muokkaa]

JavaScript[muokkaa]

Six Revisions esittelee 20 JavaScript -visualisointikirjastoa

JSON[muokkaa]

KML[muokkaa]

Keyhole Markup Language http://en.wikipedia.org/wiki/Keyhole_Markup_Language


Python[muokkaa]

Ohjelmointikieli, sopii esimerkiksi Web API-hakuihin ja raapimiseen (scraping). Googlen listaus suomenkielisistä Pyhton -oppaista. Ohjelmointiputkan opas on kokeiltu ja hyväksi havaittu

REST[muokkaa]

Scraping, skreippaus[muokkaa]

Web API[muokkaa]

Nettityökalut[muokkaa]

Google Fusion Tables[muokkaa]

Antti Poikola, Otavan opisto: Google Fusion Tables tutoriaali - Suomen kuntien visualisointi kartalle

Google Refine[muokkaa]

Antti Poikola, Otavan opisto; Datan siivousta tehokkaasti – Google Refine Tuostakaan johdatuksesta ei vielä selviä, että Google Refine pitää ensin *asentaa* omalle koneelle ennen kuin mikään alkaa toimia :)

ScraperWiki[muokkaa]

Ohjelmat[muokkaa]

Gephi[muokkaa]

Avoimen lähdekoodin verkostoanalyysiohjelma, josta on nopeasti tullut erittäin suosittu muun muassa sen ylivoimaisten visualisointiominaisuuksien sekä suhteellisen helppokäyttöisyyden vuoksi - esimerkiksi akateemiseen 'standardiin' UCINETiin verrattuna.

R[muokkaa]

R (www.r-project.org) on laskennallinen ohjelmointikieli, jolla dataa voi käsitellä ja visualisoida nopeasti ja vuorovaikutteisesti. R-kielen kautta on saatavilla kattavat kirjastot tilastolliseen analyysiin ja tiedonlouhintaan, ja sitä käytetään laajasti muun muassa bioinformatiikassa, ekologiassa, ekonometriassa, tilastotieteessä ja muilla dataintensiivisillä tieteenaloilla. R perustuu avoimeen lähdekoodiin, ja kuka vain voi luoda kieleen uusia välineitä datan käsittelyyn. R tarjoaa tehokkaat ja monipuoliset välineet datan laskennalliseen käsittelyyn, mutta vastaavasti sen oppimiskynnys on korkeampi. Kielelle luodut tutoriaalit, wikisivustot, ja yhteisöfoorumit voivat auttaa alkuun pääsemisessä. Suomessa R-osaajia löytää esimerkiksi IRCnetin kanavalta #r-project.

Datawiki: ohjeet R-laskentaympäristölle

Tiedostopäätteet[muokkaa]

.csv[muokkaa]

Teksti/ASCII-tiedostomuoto, jossa data erotetaan pilkuilla toisistaan. Avataan usein esimerkiksi Excelissa (Import Data) http://fi.wikipedia.org/wiki/CSV . Esimerkki:

Vuosi,Merkki,Malli,Pituus
1997,Ford,E350,2","34
2000,Mercury,Cougar,2","38

Tausta ja siemenversion tekijät[muokkaa]

Opintokokonaisuuden rakenteen sekä materiaalin tuottaminen on aloitettu ESR-rahoitteisen Avoimet verkostot oppimiseen (AVO) -hankkeessa. Siemenversion koosti Kari A. Hintikka 2012 aineistoissa mainittuine lähteineen. Lisksi Ideointiin ja kirjoittamiseen ovat osallistuneet muun muassa seuraavat asiantuntijat:



Materiaalin siemenversio on tuotettu osana AVO-hanketta. Hanketta rahoittavat Euroopan unionin sosiaalirahasto sekä Lapin ELY.