Ogólna Teoria Względności Einsteina (OTW) postuluje równoważność masy i energii, związanych ze sobą znanym powszechnie równaniem:

E = mc2

Gdzie m jest masą poruszającego się ciała, a c - dobrze zdefiniowaną prędkością światła w próżni, równa w przybliżeniu 300 000 km/s, zaś E jest energią posiadaną przez spoczywające ciało o masie m. 

Słuszność powyższego wzoru została wielokrotnie potwierdzona eksperymentalnie w akceleratorach cząstek, reaktorach jądrowych oraz przy wybuchach bomb nuklearnych. Zwłaszcza w tym ostatnim przypadku obserwuje się spektakularną zamianę niewielkiej części masy jąder atomowych uranu budującego bombę w potężną energię eksplozji.

W rzeczywistości droga Einsteina do znalezienia tej zależności była długa i zawiła. Wszystko rozpoczęło się sformułowaniem we wrześniu 1905 roku Szczególnej Teorii Względności (STW), mającej bardziej geometryczny charakter i podającej równania ruchu światła w przestrzeniach pozbawionych masy. OTW, powstała kilka lat później, była w zasadzie uogólnieniem STW na przestrzenie zakrzywione poprzez rozkład mas, a więc dotyczyła realnej sytuacji fizycznej. Co ciekawe, pierwsze podjęte przez Einsteina wysiłki zmierzające do zapisania zależności pomiędzy masą a energią w ruchu z dużymi prędkościami relatywistycznymi były, według źródeł historycznych, niezupełnie poprawne z punktu widzenia logiki. Opierały się one na wytracaniu energii promienistej przez ciała inercjalne emitujące falę elektromagnetyczną w postaci światła. Wysunięto także przypuszczenie, że postać gotowego wzoru została przez Einsteina w genialny sposób przewidziana i z góry założona na potrzeby obliczeń. Przypadki takie mają czasem miejsce, gdy mamy do czynienia z najwybitniejszymi uczonymi obdarzonymi tzw. intuicją fizyczną.

Zasadę równoważności można łatwo zrozumieć, o ile pojmiemy przedtem kilka innym praw fizyki, między innymi zasady zachowania. Zasady te są niepodważalnymi aksjomatami nauki i dotyczą najrozmaitszych nie zmieniających się wielkości (masa, pęd, energia, liczba atomowa itd.). Dla naszych rozważań wystarczy w zupełności zachowanie energii i masy.

Zgodnie z zasadą zachowania energii kinetycznej (związanej z ruchem ciał), w układzie odizolowanym suma składowych wszystkich energii ciał układu jest stała w czasie. Dobrze ilustrującym to prawo przykładem jest wahadło fizyczne zawieszone pomiędzy dwoma punktami, które można przykładowo oznaczyć jako A i B. Punkty te, wraz z trzecim punktem C, leżącym poniżej, w dolnym punkcie toru wahającego się ciała, wyznaczają trajektorię. Niech h jest odległością pomiędzy punktami A,B a punktem C. W położeniu A i B energia kinetyczna i prędkość wynoszą zero dla maksymalnego h, z kolei w C - energia kinetyczna jest największa, a "wysokość" h wynosi zero. Jeżeli przyjmiemy, że h związane jest z wartością innego typu energii, zwanego energią potencjalną ciała i zdefiniowaną przez nakład pracy, jaki trzeba włożyć celem podniesienia ciała na tę wysokość, to zasadę zachowania energii wyraża dla tego przypadku równanie:

mgh = (mv2)/2

Pierwszy człon stanowi energię potencjalną, drugi po znaku równości - energię ruchu. "m" jest masą ciała, a "g" wartością działającego na nie przyciągania ziemskiego. Z powyższych rozważań wynika wyraźnie, że w układzie oscylującego wahadła pewna wielkość jest niezmiennie zachowana, ponieważ gdy w punktach A,B pierwszy czynnik rośnie, drugi maleje do zera, a dla punktu C jest dokładnie na odwrót. Zachowana wielkością jest całkowita energia wahadła. Suma obu składników jest identyczna dla dowolnego punktu trajektorii! Można jednak zapytać, jak ma się do tego wszystkiego obecność energii cieplnej ruchu cząstek wahadła, i co stanie się z energią całkowitą przy działaniu sil tłumiących. Okazuje się, że energia cieplna też musi być wówczas zachowana, co oznacza, że ciepło może dość swobodnie przepływać z ciała do ciała. Ciepło jest niczym innym jak energią wydzielana spontanicznie przy obecności tarcia materiału o materiał. Do otrzymania ciepła (ogrzania czegokolwiek) koniecznie jest dostarczenie ciału odpowiednio dużej porcji energii mechanicznej (lub, zamiennie, elektrycznej, ale tym chwilowo nie będziemy się zajmować.) Wynika z tego, że dla wahadła energia (praca włożona w silę tarcia) przekształca się w ciepło wahadła. Zachowanie obu wielkości stanowi zatem jedną i ta samą zasadę: zasadę zachowania energii całkowitej układu. Powyższe rozważania da się uogólnić na wszystkie inne formy energii.

Pozostaje nam tera zbadać, co właściwie oznacza zachowanie masy w procesach fizycznych. Rozważamy przy tym masę bezwładnościową (inercjalną), zdefiniowaną jako zdolność ciała do opieraniu się działającej na nie sile. Dowiedziono, że masa taka jest co do wartości równa masie grawitacyjne, związanej z przyciąganiem ciała przez inne masy. Zasada zachowania masy głosi, że masa jest wielkością charakteryzującą daną materię i nie może zmieniać się co do wartości przy przejściach fazowych. Inaczej mówiąc, procesy takie jak parowanie, topnienie czy sublimacja nie zmieniają masy wyjściowej określonej substancji. Problem pojawił się tu jednak wraz z narodzinami Teorii Względności. Masa nie była tu dłużej zachowana. Dopiero po ujednoliceniu obu zasad zachowania (energii i masy, a w zasadzie energii, ciepła i masy) w jedno prawo (zasadę równoważności) obserwacje i teoria zaczęły się znakomicie ze sobą zgadzać.

Przypuśćmy, że zależność daną wzorem z początku tego rozdziału zapiszemy w sposób jawny względem masy. Wówczas otrzymamy wniosek, iż jednokrotnemu zwiększeniu energii spoczynkowej ciała towarzyszy zwiększenie jego masy inercyjnej o czynnik E/c2. Oznaczałoby to, że mała ilość masy zawiera w sobie ogromne ilości energii potencjalnej. Energia ta jest jednak uwięziona w strukturze materii i nie jest wcale łatwa do odzyskania i ponownego wykorzystania. Zwiększyć energię jednego grama substancji jest bardzo prosto, ale zaobserwowanie zauważalnych zmian ciężaru jest niemal niemożliwe bez precyzyjnej aparatury pomiarowej. Łatwo to zrozumieć, analizując wzór E = mc2. Dużą wartością jest tutaj czynnik, który jednak zostaje pomnożony przez mianownik otrzymanego ułamka. Jedyne zjawisko fizyczne, dostarczające ogromnej energii w odniesieniu do danej masy, to rozpad promieniotwórczy jąder atomowych. Tylko w tym przypadku można zaobserwować istotny wzrost masy układu. Załóżmy, że pewne jądro o masie M ulega rozpadowi na dwa inne jądra o masach M1 i M2, oddalające się od siebie na skutek odrzutu ze znaczną prędkością. Nowo powstałe atomy mają łączną energię mniejszą niż energia pierwszego atomu. Jest to jak najbardziej zgodne z zasadą równoważności masy i energii. Część początkowej masy jądra sprzed rozpadu została tu zużyta na energię kinetyczną odrzutu nowych jąder. Słuszność powyższego rozumowania dowodzą wielokrotnie przeprowadzane doświadczenia z rozpadami radioaktywnymi. Mimo niemożności zważenia pojedynczych jąder wykorzystuje się bardziej pośrednie sposoby określania mas produktów rozpadu oraz ich prędkości i, co się z tym wiąże, energie. Co więcej, zasada równoważności umożliwia obliczenie energii kinetycznej danego rozpadu jądrowego przy znajomości samych znanych mas atomowych danych pierwiastków. Tę możliwość wykorzystano przy określaniu spodziewanej energii pierwszych wybuchów nuklearnych, gdzie zresztą różnice między oszacowaniami a faktycznym wynikiem testów były dość duże. Zasada równoważności nie jest natomiast w żaden sposób w stanie przewidzieć, kiedy dokładnie, po jakim czasie od danego wydarzenia i jakim sposobem nastąpi rozpad jądra. Pytania te to bardziej pole do popisu dla mechaniki kwantowej, która zresztą także nie umie udzielić na nie odpowiedzi innych niż oszacowania statystyczne dla dużego zbioru radioaktywnych atomów.