sabato 11 marzo 2017

BOLTZMANN, LA DISTRIBUZIONE CANONICA E QUELLA DI MAXWELL-BOLTZMANN (2° ED ULTIMA PARTE)

Riprendiamo la trattazione come detto cercando di andare innanzitutto a fornire una definizione statistica della temperatura.
Consideriamo 2 grossi sistemi che scambiano energia l’uno con l’altro, ma non con qualcos’altro, ovvero 2 sistemi in contatto termico fra loro, ma termodinamicamente isolati dall’ambiente.
Indichiamo con E1 l’energia del primo sistema e con E2 quella del secondo sistema.
L’energia totale E = E1 + E2 si assume perciò costante, dato che i 2 sistemi non scambiano energia con nient’altro.
Dunque il valore di E1 è sufficiente per determinare il macrostato del sistema congiunto.
Ciascuno dei sistemi può chiaramente presentare un numero (molto grande) di possibili microstati.









Assumiamo che il sistema n.1 può essere in qualsiasi degli Ω1(E1) microstati e il sistema n.2 può essere in qualsivoglia degli Ω2(E2) microstati.
Ergo, l’intero sistema può essere in uno degli Ω1(E12(E2) microstati.
I sistemi sono in grado di scambiarsi energia reciprocamente e si assume che essi siano stati lasciati a contatto per un tempo sufficientemente lungo da consentire il raggiungimento dell’equilibrio termico.
Ciò implica che E1 ed E2 sono giunti a valori fissi.
L’intuizione cruciale che possiamo compiere è che un sistema tenderà ad assumere una configurazione macroscopica massimizzante il numero di microstati.
Questa idea si base sui seguenti presupposti:

1) ciascuno dei possibili microstati di un sistema è egualmente probabile nel verificarsi;
2) le dinamiche interne del sistema sono tali che i microstati del sistema cambiano ininterrottamente;
3) fornito sufficiente tempo, il sistema esplora tutti i possibili microstati e spende lo stesso tempo per ognuno di essi (ipotesi ergodica).


Tali assunzioni implicano che il sistema sarà molto probabilmente trovato in una configurazione rappresentata dal maggior numero di microstati.
Per un sistema ampio, la nostra indicazione “molto probabilmente” diviene “probabile in modo schiacciante”.
Quella che di primo acchito sembra una poco rilevante dichiarazione probabilistica (un po’ come le previsioni meteo di 5 giorni) diventa una predizione assolutamente affidabile a cui affidarsi.
Per il nostro problema dei 2 sistemi connessi la più probabile divisione dell’energia fra i 2 sistemi è quella che massimizza il prodotto Ω1(E12(E2), perché questo corrisponderà al numero più elevato di microstati possibili.
Il nostro sistema è ampio, dunque ci son permessi gli strumenti dell’analisi matematica per studiarne le proprietà.
Possiamo perciò considerare il compiere cambiamenti infinitesimali all’energia di uno dei sistemi e osservare cosa ne consegue.
Dunque, possiamo massimizzare questa espressione relativamente a E1 scrivendo





Sfruttando ora la famosa regola di Leibniz relativa al prodotto delle derivate


Si noti che nella seconda parte dell’uguaglianza si è anche moltiplicato e diviso per la quantità dE2.
Siccome l’energia totale E = E1 + E2 è assunta costante, questo implica che


e perciò


Dunque possiamo riscrivere (avendo anche diviso tutta l’espressione per Ω1Ω2) l’equazione ricavata con la regola di Leibniz come


da cui (integrando):


La suddetta condizione definisce la suddivisione più probabile di energia tra i 2 sistemi, a patto che ad essi sia consentito lo scambio di energia, visto che massimizza il numero totale di microstati.
Questa ripartizione di energia è naturalmente spesso chiamata “essere alla medesima temperatura”; ergo identifichiamo d ln Ω/dE con la temperatura T (così che T1 = T2).
Definiamo perciò la temperatura T mediante la formula


ove kB è la costante di Boltzmann, che vale 1,3807 × 10-23 JK-1.
Scegliendo tale costante, T assume la sua tradizionale interpretazione e risulta misurata in kelvin.
Stiamo utilizzando la probabilità per descrivere i sistemi termodinamici e il nostro approccio consiste nell’immaginare di ripetere ancora ed ancora un esperimento per misurare una proprietà di un sistema, giacché non possiamo controllare le proprietà microscopiche (come descritte dai microstati del sistema).
Per dare una formulazione rigorosa a tutto ciò, Josiah Willard Gibbs introdusse nel 1878 il concetto di ensemble, cioè di insieme statistico.
Trattasi di un’idea teorica nella quale si considera di produrre un elevato numero di “fotocopie mentali” del sistema, ognuna delle quali rappresenta un possibile stato nel quale il sistema può essere.
In altre parole, un ensemble è un assemblaggio di tutti i possibili microstati del sistema (assieme alle sue repliche)
, compatibili con un dato stato macroscopico.
O ancora, equivalentemente, un ensemble è l'insieme di tutti i sistemi che si trovano nelle stesse condizioni macroscopiche del sistema dato.
Dunque, sotto circostanze ordinarie, possiamo aspettarci che il comportamento medio di un sistema qualsiasi in un ensemble sia identico al comportamento medio nel tempo del sistema considerato.
Su questi fondamenti si sviluppa la cosiddetta teoria degli ensembles.
Esistono 3 tipologie principali di ensemble di gran utilizzo in termodinamica statistica:

1) ensemble microcanonico: un insieme di sistemi in cui ognuno presenta il medesimo valore definito di energia e numero di particelle (sistemi isolati);
2) ensemble canonico: un ensemble di sistemi, ognuno dei quali può scambiare la sua energia con una grande sorgente di calore. Ciò fissa e definisce la temperatura del sistema;
3) ensemble gran canonico: un insieme di sistemi, ognuno dei quali può scambiare sia energia sia particelle con una grande sorgente di calore. Ciò rende fissa la temperatura del sistema e una quantità nota come potenziale chimico del sistema.

Consideriamo una coppia di sistemi che possono scambiare fra loro energia.
Questa volta supporremo uno dei 2 enorme e lo chiameremo serbatoio termico infinito (reservoir or heat bath in inglese).
Esso è così grande che anche sottraendo ad esso un mucchio di energia rimarrebbe sostanzialmente alla medesima temperatura.
In altri termini, il serbatoio termico infinito presenta una capacità termica infinita per cui qualsiasi sia il valore finito di calore scambiato (Q) non si ottiene praticamente alcuna variazione di temperatura (ΔT = 0).
La questione è assai simile a recarsi sulla spiaggia e levare un cucchiaino d’acqua al mare: il livello del mare non si abbasserebbe (in verità sì, ma di un fattore talmente minuscolo da essere irrilevante).
Il numero di modi di organizzare i quanti di energia del serbatoio sarebbe quindi colossale.
Al contrario, il secondo sistema viene considerato minuscolo e denotato semplicemente come “sistema”.
Assumeremo che per ogni energia permessa del sistema sussista solo un microstato e, pertanto, il sistema avrà sempre valore Ω pari a 1.
Poniamo fissa l’energia totale E del sistema + serbatoio.
A tal proposito, il sistema + serbatoio può essere considerato (nell’interezza) alla stregua di un ensemble microcanonico (che ha energia fissata), con ciascuno dei microstati dell’entità combinata egualmente probabile.
Si suppone che l’energia del serbatoio sia Eϵ (anche se praticamente è equivalente ad E), mentre quella del sistema sia ϵ.
La situazione descritta di un sistema in contatto termico con un vasto serbatoio è di notevole importanza ed è nota come ensemble canonico.

Il termine “canonico” significa letteralmente parte del “canone”, ossia il deposito delle cose generalmente designate come da sapere.
Focalizzarsi infatti su un sistema la cui energia non sia fissata, ma che può scambiare energia con un grosso serbatoio, è qualcosa di molto comune in termodinamica e dunque, in un certo senso, canonico.
La probabilità P(ϵ) che il sistema abbia energia ϵ risulta proporzionale al numero di microstati accessibili al serbatoio, moltiplicato per il numero di microstati accessibili al sistema.
Dunque:


Ricordando l’espressione descrivente la temperatura in termini del logaritmo naturale di Ω, ovvero


siccome ϵ E, possiamo compiere uno sviluppo di Taylor-Maclaurin per il termine ln Ω(E - ϵ) intorno a ϵ = 0.
Ricordiamo che un generico sviluppo di Taylor-Maclaurin è dato da:


Quindi abbiamo nel nostro caso


da cui


ove T = temperatura del serbatoio.
La scelta di compiere lo sviluppo su ln Ω anziché su Ω(E) si deve al fatto che quest’ultima è una funzione di E che varia molto più rapidamente rispetto alla prima.
Infatti la nota formula di Boltzmann S = kB ln Ω relativa all’entropia suggerisce che ln Ω abbia un comportamento relativamente buono.
Passando agli esponenziali l'espressione di cui sopra diviene:



A questo punto la distribuzione di probabilità descrivente il sistema si esprime attraverso la formula:


Dato che il sistema è ora in equilibrio con il serbatoio, devono avere anche la medesima temperatura.
Va osservato però che sebbene il sistema abbia ormai una fissata temperatura T, lo stesso non si può dire dell’energia ϵ, che è governata dalla distribuzione di probabilità illustrata.
Essa è nota come distribuzione di Boltzmann o distribuzione canonica (così come la chiamò Gibbs nel 1901 nel saggio Elementary Principles in Statistical Mechanics).
Il termine

è noto come fattore di Boltzmann.
Dunque abbiamo una distribuzione di probabilità che descrive esattamente il comportamento di un piccolo sistema quando accoppiato a un vasto serbatoio alla temperatura T.


Il sistema ha una ragionevole chance di raggiungere un’energia ϵ che sia minore di kBT, ma l’esponenziale nella distribuzione di Boltzmann inizia rapidamente a ridurre la probabilità di giungere a un energia assai maggiore di kBT.
Per quantificare tutto ciò in modo rigoroso è necessario “normalizzare” (cioè assicurarsi che la somma su tutte le probabilità sia 1) la distribuzione di probabilità.
Se il sistema è in contatto con un serbatoio e ha un microstato r di energia Er, allora


dove la sommatoria presente nel denominatore assicura che la probabilità sia normalizzata.
Tale somma nel denominatore è spesso denominata funzione di partizione e indicata col simbolo Z, mentre Max Planck la indicò come Zustandsumme (ecco spiegato l’utilizzo della lettera Z), letteralmente “somma sopra gli stati”.
La funzione di partizione è molto più di una semplice “costante di normalizzazione”: tramite essa è anzi possibile derivare tutte le proprietà termodinamiche di un sistema in equilibrio termico con un serbatoio.
Che cosa abbiamo guadagnato nel passare dalla descrizione microcanonica a quella canonica?
Moltissimo. La funzione di partizione si ottiene infatti sommando sulle probabilità di tutti gli stati, senza dover preselezionare quelli corrispondenti ad un fissato valore di un parametro quale l’energia, dando semplicemente a ciascuno di essi un “peso” maggiore o minore mediante il fattore di Boltzmann.
Vedremo ora come si applicano i concetti appena illustrati alle proprietà dei gas.
Analizzeremo infatti la teoria cinetica dei gas, nella quale è il moto di atomi di gas individuali (comportandosi sulla base della distribuzione di Boltzmann) a determinare quantità come la pressione di un gas o il tasso di effusione.
La teoria cinetica comparve per la prima volta nell’opera Hydrodynamica, pubblicata da Daniel Bernoulli nel 1738.
I rudimenti dell’approccio cinetico di Bernoulli vennero successivamente sviluppati da Clausius.
Giusto per fare un esempio, Bernoulli descrisse la pressione esercitata da un gas sulle pareti di un contenitore in termini di collisioni delle sue molecole costituenti.












Osserveremo l’applicazione della distribuzione canonica al problema del moto delle molecole in un gas.
Trascureremo ogni moto di natura rotazionale o vibrazionale delle molecole e considereremo solo moti traslazionali (perciò tali risultati saranno strettamente applicabili unicamente a gas monoatomici).
In questo frangente l’energia della molecola è fornita da


dove


è il vettore velocità molecolare e


è il modulo di tal vettore.
Questo vettore velocità molecolare può esser rappresentato nello spazio delle velocità come nella seguente immagine


L’obiettivo che ci poniamo è quello di determinare la distribuzione dei vettori velocità molecolare e quella dei moduli delle velocità.
Per far ciò, stabiliremo un paio di assunzioni:

1) la dimensione della molecola è assai inferiore allo spazio di separazione intermolecolare. In questo modo possiamo assumere che le molecole spendano la maggior parte del proprio tempo sfrecciando intorno alle altre e solo raramente urtando fra di loro;
2) trascureremo ogni forza di natura intermolecolare. Le molecole possono scambiare energia tra di loro tramite collisioni, ma tutto rimane in equilibrio.

Assumeremo dunque che ogni molecola si comporti alla stregua di un piccolo sistema collegato a un serbatoio termico di temperatura T, ove il serbatoio rappresenta “tutte le altre molecole del gas”.
Ergo, la distribuzione di Boltzmann delle energie la farà da padrone!
Per comprendere al meglio la trattazione sulle distribuzioni di velocità, occorre compiere un breve excursus relativo alla funzione detta gaussiana.
Una gaussiana è una funzione della forma e-α, rappresentata graficamente come segue:



Essa possiede un massimo in x = 0 e la sua forma ricorda quella di una campana.
L’integrale di una gaussiana risulta assai utile


Ecco che appare nella sua magnificenza il nostro pi greco, che d'ora in avanti sarà una presenza fissa nella narrazione.
Differenziamo ora entrambi i membri dell’equazione rispetto ad α.
Siccome x non dipende da α, tutto ciò risulta molto semplice.
Abbiamo infatti che:




allora



Ripetendo ancora il trucchetto, cioè differenziando ancora otteniamo alla fine che




Dunque abbiamo rinvenuto un modo di generalizzare gli integrali tra -∞ e ∞ di x2ne-α, dove n ≥ 0 è un numero intero.


Giacché queste funzioni sono pari, i loro integrali, calcolati tra 0 e ∞, sono equivalenti alla metà del valore degli stessi integrali, calcolati tra -∞ e ∞, come possiamo di seguito notare:


Integrare x2n+1e-α tra -∞ e ∞ è facile: le funzioni sono tutte dispari e perciò gli integrali sono tutti equivalenti a 0.
Per integrare tra 0 e ∞, incominciamo col valutare


notando che xe-α è quasi il valore che si ottiene calcolando la derivata (d/dα)e-α.
Tutte le potenze dispari di x si possono così ottenere differenziando quell’integrale rispetto ad α.


Di seguito dei casi particolari rilevanti:


Per sviluppare la distribuzione dei vettori velocità delle molecole di un gas bisogna innanzitutto fissare una direzione e osservare quante molecole abbiano particolari componenti del vettore velocità lungo essa.
Definiamo infatti la funzione di distribuzione del vettore velocità come la frazione di molecole con velocità, nella fissata direzione x (ma possiamo scegliere qualsiasi direzione ci aggradi), compresa fra vx e vx + dvx.
Essa viene denotata con g(vx)dvx e risulta proporzionale al fattore di Boltzmann, come mostra la seguente formula:




Al fine di normalizzare tale funzione (che è una gaussiana), in modo che


è necessario valutare l’integrale (ricordando l’espressione dell’integrale generale di una gaussiana)


in maniera tale da avere


Tenendo in considerazione alcuni integrali relativi alla funzione gaussiana (illustrati poco fa) è possibile trovare i seguenti valori attesi della suddetta distribuzione:


Ovviamente, non importa quale sia la componente del vettore velocità inizialmente scelto: risultati identici sarebbero stati ottenuti per vy e vz.
Dunque la distribuzione dipende unicamente dal modulo della velocità e non dalla direzione, perciò si può asserire che tale distribuzione di probabilità sia isotropica.
Dato che la direzione del moto molecolare è irrilevante, allora una procedura di riduzione genererebbe una distribuzione di probabilità unicamente per il modulo della velocità.
Vediamo quindi come sviluppare la distribuzione dei moduli delle velocità molecolari in un gas.
Dobbiamo innanzitutto considerare la porzione di molecole che stanno viaggiando con velocità comprese fra


e v + dv.
Ciò corrisponde ad un guscio sferico nello spazio delle velocità di raggio v e spessore dv.



In generale, per gusci sferici dalle pareti sottili, il volume può essere descritto come l’area della sfera di raggio R (ossia 4πR2) moltiplicato per lo spessore t del guscio:


Il volume dello spazio delle velocità corrispondente a velocità comprese tra v e v + dv risulta perciò dato da


In maniera che la frazione di molecole con velocità tra v e dv possa essere definito come f(v)dv, ove f(v) è descritto dalla formula


In tale espressione il fattore 4π è stato assorbito dal simbolo di proporzionalità.
Per normalizzare (integrando tra 0 e ∞, e non tra -∞ e ∞, poiché il modulo v è una quantità positiva) questa funzione, in modo che 


dobbiamo valutare l’integrale


in modo che si abbia


Tale distribuzione dei moduli della velocità prende il nome di distribuzione di Maxwell-Boltzmann o semplicemente distribuzione maxwelliana (Maxwell giunse appunto ad una forma simile nel 1860).


Cerchiamo ora di dedurre alcune proprietà di tale importante distribuzione.
Facendo riferimento agli integrali particolari della gaussiana (in particolare quello per x3e-α ed x4e-α), possiamo ricavare i seguenti valori attesi della distribuzione di Maxwell-Boltzmann:


Notiamo inoltre che


E ancora, osserviamo che la radice della media dei quadrati, detta anche valore quadratico medio (in inglese root mean square, abbreviato rms), delle velocità molecolari

risulta proporzionale a m-1/2.
Come riporta Wikipedia, in neuroscienze, si descrivono spesso i meccanismi di apertura e chiusura dei canali ionici attraverso una funzione di Boltzmann semplificata quando questi sono dipendenti dal potenziale di membrana.
La formula utilizzata è:
\frac{G(V)}{G_{max}}=\frac{1}{1+e^{\frac{V-V_{1/2}}{k}}} ,
dove
  • V è il potenziale di membrana,
  • G(V) è la conduttività elettrica ionica associata ai canali, dipendente dal potenziale di membrane,
  • Gmax è la conduttività massima,
  • La metà del potenziale d'attivazione (V1/2 ) è il potenziale di membrana per cui la metà dei canali sono aperti,
  • k è la dipendenza dall'apertura dei canali in rapporto al cambiamento di potenziale.
Tirando le fila del discorso, abbiamo osservato l'interessante biografia di uno dei più importanti fisici del XIX secolo, scoprendo il suo notevolissimo contributo nell'ambito della fisica statistica e in tutto questo abbiamo potuto constatare come il pi greco, in un modo più o meno centrale, appare spesso anche in importanti concetti della fisica teorica.
Il post è stato lungo e colmo di formule (tanto che è stata necessaria una suddivisione in 2 parti), anche per omaggiare lo stile prolisso e articolato che Boltzmann era solito tenere nei suoi fondamentali papers.
Prendendo spunto da un'altra grande passione del fisico, ovvero il pianoforte, concluderei con i temi del Gladiatore di Hans Zimmer rivisitati al piano da Lang Lang nella Gladiator Rhapsody:



---------------------------------------------------------------------------------------
Fonti principali:

- Ludwig Boltzmann: The Man Who Trusted Atoms di Carlo Cercignani
- Personaggi e Scoperte della Fisica Classica di Emilio Segrè
- Concepts in Thermal Physics di Stephen J. Blundell e Katherine M. Blundell

Nessun commento:

Posta un commento