Internet stvari (IoT) pogosto razkrije svoj celotni potencial šele, ko imajo stvari določeno inteligenco – torej ko lahko analizirajo podatke, ki jih zberejo, in samodejno izvajajo dejanja. Zlasti na področju okolja in zdravja je to lahko koristna podpora ljudem, na primer z elektronskim nosom.
Rutronik GmbH
Avtor: Julian Eise
2022-205-22
Elektronski nos
Večina Evropejcev in Severnoameričanov večino časa preživi v zaprtih prostorih. Kakovost zraka v zaprtih prostorih močno vpliva na naše počutje: Slabša ko je, močneje vpliva na našo sposobnost presoje in koncentracije. Dolgoročno lahko to vpliva tudi na vaše zdravje. Kitajska vlada zato spodbuja podjetja, ki razvijajo izdelke za izboljšanje kakovosti zraka. Toda kaj sploh pomeni »slab zrak«?
Za kakovost zraka so odločilne hlapne organske spojine (angl. Volatile Organic Compounds, VOC). Že pri sobni temperaturi postanejo plinaste in so nato prisotne v zraku kot najmanjši delci. Prihajajo iz gradbenih materialov, umetnih mas in topil, oddajajo pa jih tudi mikroorganizmi, ljudje ter živali. Zaznamo jih lahko z ustreznimi tipali. Ti vsebujejo substrat, na katerem se nabirajo VOC in reagirajo z zrakom. S tem se spremeni upornost tipala. Tipala podajajo vsebnost VOC v ppm (milijoninke).
Za odpravo velikih vrednosti VOC je pogosto koristno vedeti, od kod prihajajo delci. Tukaj vam bomo na primeru VOC iz parfuma, alkohola in kisa pokazali, kako algoritmi za podatkovno rudarjenje razvrščajo različne VOC ter jih določijo posameznim snovem. To so idealne snovi za naš namen, saj gre za običajne gospodinjske snovi, katerih VOC so lahko v visokih koncentracijah škodljivi za ljudi in jih zlahka zaznamo s tipali VOC.
Kako pridobimo referenčne podatke za algoritem za podatkovno rudarjenje
Osnova za analizo so meritve. Z njimi dobimo referenčne podatke, potrebne za razvoj algoritma za podatkovno rudarjenje. V ta namen se poleg tipala VOC uporablja tudi tipalo temperature in vlažnosti, saj obe vrednosti vplivata na obnašanje VOC.
Z združevanjem tipal, kar pomeni kombiniranje različnih izmerjenih vrednosti v eno vrednost, smo ustvarili nabor podatkov, ki ga je mogoče analizirati. Združevanje tipal poleg tega zmanjšuje vpliv motenj med meritvami in tako zagotavlja robustnejši celoten sistem ter zanesljivejše zaznavanje posameznih elementov. To je še zlasti pomembno pri meritvah VOC, saj lahko že majhna odstopanja močno popačijo rezultat meritve. Poleg tega je bilo treba upoštevati tudi dejavnike, ki vplivajo na tipala, na primer dolgoročno lezenje ali točnost signala.
Serije meritev so bile izvedene s sistemom, ki poustvarja naravno okolje s snovmi VOC (slika 1).
Pod zaprtim prostorom je majhna komora. V to komoro smo postavili posodo s parfumom, alkoholom ali kisom. Med meritvami je bila komora na vrhu odprta, da so lahko hlapne organske spojine ušle v večji prostor. Majhen ventilator v komori je bil namenjen povečanju pretoka snovi VOC. Ventilatorji v večjem prostoru so poskrbeli, da so snovi VOC pri čiščenju med dvema meritvama hitreje izhlapevale.
Tako komora kot večji prostor sta vsebovala razvojno ploščo, na katero je bila nameščena plošča s tipali za VOC s ploščo Environmental Sensor Shield iz podjetja Sensirion. Ta združuje tipalo SGP30 za zaznavanje VOC in CO2 s tipalom SHTC za merjenje vlažnosti ter temperature.
Vohanje vsako sekundo
Med meritvami je bila vsako sekundo programsko določena izmerjena vrednost s časovno oznako. Za zagotovitev zanesljivosti meritev smo vsako meritev s snovjo ponovili desetkrat. Kot primer kažemo meritve s parfumom. Vrednosti iz majhne komore (slika 2) niso kazale enotnih rezultatov: 550 sekund po začetku meritve je bila koncentracija VOC med 22.000 in 60.000 ppm, pri čemer je 60.000 ppm največja vrednost, ki jo tipalo še lahko zazna. Korelacijsko preverjanje je pokazalo, da so bile največje vrednosti izmerjene pri najvišjih temperaturah.
Meritve v večjem prostoru (slika 3) so pokazale skoraj nasprotno sliko: Polovica krivulj kaže počasno naraščanje skozi deset minut meritve, le dve sta naraščali hitro in dosegli raven VOC nad 2500 ppm. Dve drugi sta bili ves čas enaki linearni z maksimumom približno 600 ppm. Največja vrednost vseh meritev s tem tipalom je znašala 7600 ppm. Tudi tu so najvišje koncentracije VOC sovpadale z najvišjimi temperaturami. Poleg tega so meritve z velikimi vrednostmi vlažnosti pokazale hitrejše naraščanje vrednosti VOC.
Tipičen parfum, tipičen kis?
Ko smo meritve opravili tudi z alkoholom in kisom, smo lahko primerjali rezultate. Na prvi pogled so vrednosti VOC za alkohol (slika 4, modre krivulje) in parfum (slika 4, rdeče krivulje) podobne. Razlog za to je, da parfum vsebuje približno 80 % alkohola. Pri kisu je bistveno drugače: Te snovi VOC izhlapevajo veliko počasneje kot iz drugih dveh snovi. To je bil zaključek meritev v komori: Fizično razlikovanje je mogoče le med kisom in parfumom ter alkoholom, ne pa med parfumom in alkoholom.
Drugače je bilo pri meritvah v večjem prostoru (slika 5): Tukaj so se pokazale tudi razlike med parfumom in alkoholom: VOC iz parfuma so hlapele hitreje iz alkohola. Tudi tu kis jasno odstopa od ostalih dveh snovi.
Algoritem za rudarjenje podatkov se nauči vohati
Tako smo dobili podlago za algoritem za podatkovno rudarjenje. Prvi korak algoritma je analiza glavnih sestavin (angl. Principal Component Analysis, PCA). S tem lahko obsežne podatkovne nize poenostavimo in ponazorimo. Pri eksperimentu z elektronskim nosom to pomeni: Iz podatkov smo ustvarili tri barvne oblake, ki grafično predstavljajo parfum, alkohol in kis ter jih tako nedvoumno ločijo (slika 6). Edina izjema: Odčitek parfuma 01 se obnaša podobno kot odčitki alkohola in je zato v modrem oblaku, ki predstavlja alkohol. Takšna odstopanja lahko uporabimo za učenje sistema in izboljšanje ločevanja.
V drugem koraku smo zasnovali algoritem za rudarjenje podatkov. Za to smo uporabili orodje Orange3, ki omogoča tri metode: logistično regresijo, nevronske mreže in odločitveno drevo. Da bi dosegli najboljše rezultate, smo preizkusili vse tri in primerjali njihove rezultate. Po podatkih iz orodja Orange3 smo najtočnejše rezultate dobili z nevronskimi mrežami, ki so dosegle točnost 98,1 %. Za primerjavo: Logistična regresija je dosegla točnost le 74,9 %.
Označene referenčne podatke, torej podatke z oznakami »parfum«, »alkohol« ali »kis«, smo nato po PCA za učenje uvozili v nevronsko mrežo. Po tem smo iz nekaterih referenčnih podatkov odstranili oznake in jih znova vnesli v nevronsko mrežo. Zdaj so se neoznačeni podatki prvič srečali z referenčnimi podatki algoritma. Šli so skozi isti postopek kot referenčni podatki, algoritem pa jih je moral pravilno dodeliti eni od treh snovi. Rezultati se vedno znova vključujejo v izračune, tako da se klasifikacija nenehno izboljšuje.
Preizkus vohanja je uspel
Zadnji korak rudarjenja podatkov je interpretacija in vrednotenje ugotovitev. To naredimo s preverjanjem točnosti izmerjenih ravni VOC in ponovitvijo meritev, da preverimo ocene algoritma.
V ta namen smo izvedli nove meritve s parfumom, alkoholom in kisom. Kot kaže slika 7, je poskus uspel: Algoritem lahko matematično razlikuje parfum, alkohol in kis, s čimer prepozna spojine na podlagi meritev VOC.
Da lahko algoritem uporabljamo v aplikaciji, je nujno razumeti, kaj ločuje in zakaj. V ta namen je treba pridobljeno znanje utemeljiti in dokumentirati z referenčnimi podatki. Nato je mogoče določiti nadaljnje korake, na primer sprožitev opozorilnega signala, ko so zaznane velike vrednosti VOC za alkohol.
Če referenčnim podatkom dodajamo na novo zabeležene in razvrščene VOC, se natančnost algoritma postopoma povečuje. Večja podatkovna zbirka namreč omogoča boljše rezultate algoritma. Če ga nato uporabimo v uporabniški aplikaciji, lahko shrani tudi na novo zaznane spojine, se uči z dodatnimi podatki in nato nove spojine tudi razvršča. Poleg tega so mogoče tudi napovedi, s katerimi lahko aplikacija z zelo malo izmerjenimi vrednostmi že napove vir.
Zaključek
Povsem fizično razlikovanje VOC za različne snovi ni izvedljivo na nedvoumen način. To je mogoče le z algoritmom za rudarjenje podatkov. Za to zadošča že relativno majhna količina referenčnih podatkov, vendar pa se s številom meritev povečujeta zanesljivost podatkov in natančnost razvrščanja.
In še nekaj: Razvoj tipal VOC je šele na začetku. Mnogi proizvajalci si trenutno prizadevajo za boljše razumevanje VOC. Z boljšim strokovnim znanjem bodo tipala zagotavljala boljše in zanesljivejše rezultate meritev.
Rutronik GmbH,Podružnica v Ljubljani
Motnica 5, 1236 Trzin, Slovenia
E-pošta: rutronik_si@rutronik.com
Tel. +386 1 561 09-80
https://www.rutronik.com