Consisteix en un visor, normalment estereoscòpic per tal de crear efecte de profunditat, que emet la sortida d’imatge del sistema a prop dels ulls, sovint amb l’ajut de petites pantalles o bé de projectors, i usant miralls o lents per a fer-la arribar als ulls. Els HMD s’aguanten en posició davant dels ulls mitjançant elements de subjecció regulable, com ara corretges o suports semblants a les ulleres convencionals; per això, al conjunt també se l’anomena casc de realitat virtual o ulleres de realitat virtual. També poden anar equipats amb auriculars per a rebre estímuls sonors. Alguns, com el Samsung Gear VR, són carcasses amb lents on es pot encaixar un telèfon mòbil, que és el que s’encarrega de mostrar les imatges i de tot el processament de l’aplicació. D’altres, com les Oculus Rift o les HTC Vive, proporcionen el sistema de visió i requereixen estar connectats a un ordinador per al processament de l’aplicació. I també n’hi ha que són completament autònoms, com les Oculus Go o les HTC Vive Focus. N’hi ha que només permeten veure la imatge que genera el mateix HMD, que pot ser d’origen completament digital o bé incorporar una entrada de càmera. D’altres estan dissenyats específicament per a realitat augmentada i permeten veure simultàniament la imatge directa del món físic i la digital, com les Hololens o les Magic Leap One.