Kuvaus


Tällä sivulla on opiskelumateriaalia R-ohjelmistosta vasta-alkajille. Käytin materiaalia opettaessani Jyväskylän yliopiston R-kurssia vuosina 2010-2012, ja sen tarkoitus on olla varsin matalan kynnyksen johdanto R-ohjelmiston käyttöön.

Jätin JYU:n, mutta säilytän tämä sivuston langoille ajatuksella että siitä on iloa R-ohjelmiston opiskelussa jollekin asiasta kiinnostuneelle mutta vähäisen ohjelmointi- tai tilastotieteen taustan omaavalle. Kaikki materiaali on suomeksi, ja soveltuu hyvin interaktiivista lueskelua harrastavalle yksinopiskelijalle.

Toivottavasti koet materiaalin hyödylliseksi.


Tuomas (4.11.12)
Laitoksen kurssi 2011

Kurssiuutisia

  1. [10/10] Syksyn toinen harkkakierros on päättynyt. Tulokset viety Korppiin, vastaukset alla.
  2. [29/9] Syksyn luentokurssi on päättynyt. Uusi harjoitustyö on alla, se on tarkoitettu sekä uusijoille että itseopiskelijoille.
  3. [9/9] Kurssin luennot ovat päättyneet. Kurssin suorittaminen vaatii harjoitustyön tekemistä, ohjeet alla olevassa pdf-tiedostossa. Palautus viimeistään su 18.9.2011 klo 23:59.
  4. [16/8] Sivu päivitetty. Tällä hetkellä Korppi-ilmoittautuminen on täynnä, mutta jos omistat läppärin voit kysyä osallistumisesta minulta. Muutenkin oman läppärin käyttö on suositeltavaa, onhan tuttua konetta mukavampi käytellä.

Linkkejä

Johdantomatskua muualla

Lisämateriaalia, blogeja, grafiikkaa yms.

  • RStudio :: Kätevä käyttöliittymä R:lle. Varsin suosittu ja monipuolinen, tukee eri käyttöjärjestelmiä ja on ilmainen.
  • IPSUR :: Ilmainen kirja+paketti tilastollisten menetelmien opetteluun apuna R.
  • R Journal :: Julkaisu jossa tekijät esittelevät R-pakettejaan.
  • r-ohjelmointi.org :: Suomenkielinen R sivusto, ylläpitäjät data-analyytikkoja.
  • Bioconductor :: Massiivinen R-pakettikokoelma, joka mahdollistaa mm. DNA microarray-aineistojen analysoinnin.
  • R Graph Gallery :: Täällä voi ihmetellä mitä kaikkea R pystyy piirtämään.
  • R-bloggers.com :: Kerää R-blogit saman katon alle.
Itseopiskelijat

R:n asennus omalle koneelle

1. Hae asennustiedosto:
»Windows: cran -> Windows -> base
»OS (mac): cran -> MacOS X
»Linux: R on suositumpien distrojen repoissa, hae sieltä suosimallasi paketinhallintaohjelmalla.

2. Asenna.

Ei muuta.

Mikä R

R on tietokoneohjelma tieteellisen laskentaan. Se on ilmainen ja yhteisövetoinen, sen toiminnallisuuksia on helppo laajentaa kirjastojärjestelmän avulla, ja se skaalautuu yksinkertaisista laskintoiminnoista aina automaattisiin DNA-sekvenssien tai suurten tietokantojen analysointitarpeisiin asti.

R on kuten: SAS, Python, graafiset laskimet.
R ei ole kuten: SPSS, Excel, C++, Java.

R-ohjelmistosta järjestetään luentokurssien ulkopuolella pari kertaa harjoitustyöhön perustuva etätentti. Mikäli tarvitset R-kurssisuorituksen ota yhteyttä vaikkapa minuun.

Vasta-alkajalle

Itseopiskelijalle, jolla ei ole aikaisempaa kokemusta ohjelmoinnista, suosittelen tekemiseksi omaa luentomonistettani (pdf). Se olettaa vähemmän taustatietoja ohjelmoinnista ja tilastotieteestä kuin moni muu tarjolla olevista johdantomonisteista (katso Linkit). Se on suunniteltu interaktiiviseen opiskeluun koneen äärellä, ja sisältää harjoituksia (vastaukset saatavilla).

Käymällä monisteen läpi saa hyvän perustuntuman R:n käyttöön ja voi alkaa erikoistumaan opiskelussaan esimerkiksi erityisalojen tilastomenetelmien R-oppaiden avulla.

Tee näin:
1. Asenna R.
2. Avaa R sekä luentomoniste.
3. Lue monistetta ja tee monisteen harjoitukset.
4. ...
5. profit!

Ohjelmointiin perehtyneille

Ohjelmointia harrastaneille R:n opiskelussa ei pitäisi olla suuria ongelmia. R on korkean tason tulkkaava ohjelmointikieli vähän niinkuin Matlab tai Python, ja kuten Python sitä voi ajella myös pelkästään komentokehoitteessa johon syötetään komentoja. Lyhyt koodiesimerkki:

   > xvec <- c(2, -3, 40, 5, 10)
   > mean(xvec)
   [1]  10.8
   > xvec <- xvec[ xvec!=max(xvec) ]
   > mean(xvec)
   [1] 3.5
      
Kolmannella rivillä käytetään totuusarvoindeksointia poimimaan kaikki muut paitsi isoin. Toinen hyödyllinen ominaisuus on kierrätys, joka mm. automatisoi silmukoita ja mahdollistaa erikokoisten alkioiden yhdistelyn:
    > xvec-mean(xvec)
    [1] -1.5 -6.5  1.5  6.5
    > xvec^2
    [1]   4   9  25 100
    > exp(xvec)
   [1] 7.389056e+00 4.978707e-02 1.484132e+02 2.202647e+04 
    > xvec+c(1,-1)
    [1]  3 -4  6  9
     

Lisää voi lueskella vaikkapa R:n mukana tulevasta virallisesta "An introduction to R" oppaasta (aja R:ssä komento help.start() tai ota CRAN:ista pdf). Tilastotieteellisesti sävyttyneen kylvyn saa esimerkiksi Mari Myllymäen monisteesta tai Peter Dalgaardin "Introductory Statistics with R" kirjasta.