Et fonem er en klasse av fonetisk like språklyder som kan ha betydningsskillende funksjon i et språk eller en dialekt. For å finne ut om språklyder har betydningsskillende funksjon bruker vi såkalte minimale par: par av ord som bare skiller seg fra hverandre ved at ett fonem er forskjellig. For eksempel er ordparet lus og rus et minimalt par, som viser at l og r er to fonemer i norsk, siden vi ved å bytte ut den ene språklyden med den andre får et nytt ord med ny betydning.
Fonemenes fonetiske realisering, altså deres faktiske uttale, kan variere etter omgivelser i ordene, etter uttalevaner og så videre. Lyder som er litt forskjellige uten at de virker betydningsskillende, kalles varianter eller allofoner av et fonem. For eksempel er både stemt r, som i bære og varm, og ustemt r, som vi finner foran ustemte konsonanter, for eksempel i ord som park og varp i flere norske dialekter, allofoner av r. Det samme gjelder skarre-r og rulle-r.
Hvert språk (og hver dialekt) har sitt eget system av fonemer. Fonemer danner utgangspunktet for alfabetisk skrift, men blant annet fordi språk endrer seg over tid, vil ortografien gjerne skille seg noe fra uttalen. For å gjengi uttalen nærmere, kan vi bruke fonemisk skrift (fonemisk transkripsjon). Fonemisk transkripsjon bruker bare ett tegn for hvert fonem, som også betegner alle allofonene av dette fonemet. For å markere at dette tegnet står for et fonem, settes det gjerne mellom skråstreker: /r/.
Fonemet spiller nå en mindre sentral rolle i fonologisk teori enn tidligere, fordi det ikke lenger regnes som en enkelt, uanalyserbar enhet, men som et sett av distinktive trekk.