Datajournalismi/Datatekniikat-opintopiiri
Tämä sivu on tarkoitettu vapaamuotoisten vertaisopintopiirien käyttöön avoimen datan ja datajournalismin tekniikoiden ymmärtämiseksi ja soveltamiseksi omaan käyttöön. Tavoitteena ei ole termien ja asioiden esittämisen eksaktius vaan niiden esittäminen ymmärrettävästi :)
Ole hyvä ja listaa tähän aakkosjärjestykseen käsitteitä ja termejä jotka haluat oppia, lisää linkkejä, kirjoita kuvauksia tai kysymyksiä tai jäsennä koko sivun rakenne uudestaan :). Tai merkitse "haluan oppia tämän" ja jokin yhteystietosi.
Käsitteet ja termit
[muokkaa]Tämän voisi purkaa erikseen muun muassa ohjelmointikieliin listan edetessä.
API
[muokkaa]JavaScript
[muokkaa]Six Revisions esittelee 20 JavaScript -visualisointikirjastoa
JSON
[muokkaa]KML
[muokkaa]Keyhole Markup Language http://en.wikipedia.org/wiki/Keyhole_Markup_Language
Python
[muokkaa]Ohjelmointikieli, sopii esimerkiksi Web API-hakuihin ja raapimiseen (scraping). Googlen listaus suomenkielisistä Pyhton -oppaista. Ohjelmointiputkan opas on kokeiltu ja hyväksi havaittu
REST
[muokkaa]Scraping, skreippaus
[muokkaa]Web API
[muokkaa]Nettityökalut
[muokkaa]Google Fusion Tables
[muokkaa]Google Refine
[muokkaa]Antti Poikola, Otavan opisto; Datan siivousta tehokkaasti – Google Refine Tuostakaan johdatuksesta ei vielä selviä, että Google Refine pitää ensin *asentaa* omalle koneelle ennen kuin mikään alkaa toimia :)
ScraperWiki
[muokkaa]Ohjelmat
[muokkaa]Gephi
[muokkaa]Avoimen lähdekoodin verkostoanalyysiohjelma, josta on nopeasti tullut erittäin suosittu muun muassa sen ylivoimaisten visualisointiominaisuuksien sekä suhteellisen helppokäyttöisyyden vuoksi - esimerkiksi akateemiseen 'standardiin' UCINETiin verrattuna.
R
[muokkaa]R (www.r-project.org) on laskennallinen ohjelmointikieli, jolla dataa voi käsitellä ja visualisoida nopeasti ja vuorovaikutteisesti. R-kielen kautta on saatavilla kattavat kirjastot tilastolliseen analyysiin ja tiedonlouhintaan, ja sitä käytetään laajasti muun muassa bioinformatiikassa, ekologiassa, ekonometriassa, tilastotieteessä ja muilla dataintensiivisillä tieteenaloilla. R perustuu avoimeen lähdekoodiin, ja kuka vain voi luoda kieleen uusia välineitä datan käsittelyyn. R tarjoaa tehokkaat ja monipuoliset välineet datan laskennalliseen käsittelyyn, mutta vastaavasti sen oppimiskynnys on korkeampi. Kielelle luodut tutoriaalit, wikisivustot, ja yhteisöfoorumit voivat auttaa alkuun pääsemisessä. Suomessa R-osaajia löytää esimerkiksi IRCnetin kanavalta #r-project.
Datawiki: ohjeet R-laskentaympäristölle
Tiedostopäätteet
[muokkaa].csv
[muokkaa]Teksti/ASCII-tiedostomuoto, jossa data erotetaan pilkuilla toisistaan. Avataan usein esimerkiksi Excelissa (Import Data) http://fi.wikipedia.org/wiki/CSV . Esimerkki:
Vuosi,Merkki,Malli,Pituus 1997,Ford,E350,2","34 2000,Mercury,Cougar,2","38
Tausta ja siemenversion tekijät
[muokkaa]Opintokokonaisuuden rakenteen sekä materiaalin tuottaminen on aloitettu ESR-rahoitteisen Avoimet verkostot oppimiseen (AVO) -hankkeessa. Siemenversion koosti Kari A. Hintikka 2012 aineistoissa mainittuine lähteineen. Lisksi Ideointiin ja kirjoittamiseen ovat osallistuneet muun muassa seuraavat asiantuntijat:
Materiaalin siemenversio on tuotettu osana AVO-hanketta. Hanketta rahoittavat Euroopan unionin sosiaalirahasto sekä Lapin ELY.