Varo ylikuntoa. Tarkempi malli kerätyistä tiedoista järjestelmästä ei välttämättä ennusta paremmin järjestelmän tulevaa käyttäytymistä.
Yllä oleva kuva näyttää kaksi mallia joistakin tiedoista.
Lineaarinen viiva on jonkin verran tarkka harjoitustiedoissa (kaavion pisteet), ja (voidaan odottaa) se on jonkin verran tarkka testaustiedoissa (missä pisteet ovat todennäköisesti x < 5: lle ja x> -5).
Sen sijaan polynomi on 100% tarkka harjoittelutiedoille, mutta (ellei sinulla ole mitään syytä uskoa 9. asteen polynomia on kohtuullinen jostain fyysisestä syystä), oletat, että tämä on erittäin huono ennustaja x> 5: lle ja x < -5: lle.
Lineaarinen malli on 'epätarkempi', mikä perustuu virheiden vertailuun keräämiemme tietojen kanssa. Mutta se on yleisempi.
Lisäksi insinöörien on vähemmän huolissaan mallistaan ja enemmän siitä, mitä ihmiset tekevät mallin kanssa.
Jos kerron teille, että olemme kävelee kuumana päivänä ja sen odotetaan kestävän 426 minuuttia. Tuodat todennäköisesti vähemmän vettä kuin jos sanon, että kävely kestää 7 tuntia, ja vielä vähemmän kuin jos sanon, että kävely kestää 4-8 tuntia. Tämä johtuu siitä, että vastaat ennusteeni epäsuoraan luottamustasoon ennalta ilmoittamieni aikojen keskipisteen sijaan.
Jos annat ihmisille tarkan mallin, ihmiset pienentävät virhemarginaaliaan. Tämä johtaa suurempiin riskeihin.
Käveleminen esimerkiksi kuumana päivänä, jos tiedän, että kävely kestää 4–8 tuntia 95 prosentissa tapauksista, navigoinnin ja kävelynopeuden suhteen on epävarmuutta. Kävelynopeuden täydellinen tuntemus vähentää 4-8-luvun epävarmuutta, mutta se ei vaikuta merkittävästi "mahdollisuuteen kestää niin kauan, että vedestä tulee kysymys", koska sitä ohjaa melkein kokonaan epävarma navigointi, ei epävarma kävelynopeus.