從反函數的觀點看逆矩陣_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!1小时前
要想讓線性代數生動起來,除了介紹一些精彩應用的例子,一個可行的辦法是強調幾何的語言。所謂幾何語言,簡單講,就是用線性變換代替矩陣,用抽象向量代替列向量。代數語言具體清晰,而幾何語言直觀明快。通常的教科書往往過分強調代數語言,導致思路曲折,概念引入缺乏動機,掩蓋了線性代數的本質。
本文從“單射”和“滿射”入手,引出反函數概念,採用更直觀的方式描述逆矩陣。這種觀點可能比通常的“−1 = −1 = ”式定義更具幾何特色,更能直接、深刻地觸及逆矩陣的數學內涵。
撰文 | 朱慧堅(玉林師範學院數學與統計學院副教授)、丁玖(美國南密西西比大學數學系教授)
我們在之前的文章《矩陣乘法為什麼是這樣定義的?》中,運用包羅萬象的抽象函數概念,論證了矩陣乘法定義中積矩陣元素表達式的合理性和必要性。與矩陣乘積運算直接相關的一個關鍵術語是“逆矩陣”,同樣,我們可以借用反函數的思想來幫助理解這個處處有用的數學對象。
單射和滿射
中學教科書裏,有一章專講“反函數”。物理學有個説法,每種基本粒子都有對應的反粒子。可惜,數學不是物理,並非每個函數都有反函數,具有反函數的函數必須滿足如下條件:它將定義域一對一地映射到值域上,符合這個要求的函數也被稱為單射(injection)。更數學化地説,一對一的函數: → 意指,對於定義域中的任意兩個元素和,若() = (),則必定有 = ;或言之,一對一的函數將定義域中的不同元素映射成值域中的不同元素。
抽象函數: → 定義中的兩個集合和,第二個集合可以換成任何一個包含它的集合,在集合論的眼裏沒有發生變化,比如一個將定義域 = {1, 2, … , 365}映射到有理數集 = 當中的函數,也可以被視為將同一個定義域映射到實數集 = 裏;雖然它們各自的並不相同,但本質上是一樣的函數。事實上,任何函數: → 中的“目標集合”都可以換成的值域(),即所有函數值組成的集合。
這樣看來,如果: → 是一對一的,那麼: → ()不僅是一對一的,而且是映上的,映上的函數也稱為滿射(surjection)。同時是單射和滿射的函數稱為雙射(bijection),即對於()中的任意一個元素,有且僅有中的一個元素使得() = 。我們稱雙射為一可逆函數。如果: → 將映射到之上,給定函數的“映上”條件保證了上述可逆函數定義中的“有”發生,而“一對一”的假設確保了“僅有”成立。本文為了討論矩陣求逆問題,我們碰到可逆函數: → 時總假設它是一個滿射,這樣,下一段引進的的反函數將定義在上。
可逆函數: → 意味着中的所有元素與中的所有元素,通過形成了一一對應關係。這種相互對應關係構成了定義的“反函數”概念之基礎。可逆函數: → 的反函數是這樣定義的:對於中的任一元素,被映射到的屬於的那個唯一存在的元素,就是這個反函
算子和可逆矩陣
有了高中生熟知的反函數概念作鋪墊,我們可用同樣的思想引進大學線性代數中逆矩陣的
其中是階的單位矩陣,其對角元素為1,其餘元素為0。單位矩陣和任何矩陣如能合法相乘,即左邊矩陣的列數等於右邊矩陣的行數,不論它是左乘還是右乘,結果都是那個被乘矩陣,如同數1在算術中的角色。單位矩陣所對應的線性算子是恆等算子,即它把每個向量映到自己。
在絕大多數線性代數教科書中,公式(2)通常用作逆矩陣的定義,即對於給定的階方陣,如果存在階方陣,使得等式 = 和 = 都成立,則稱為的逆矩陣。按照如上的算子觀點,在此定義中,第一個等式 = 意味着是一對一的線性算子(因為若非如此,則存在兩個不同的向量和使得 = ,從而 = = = ,與 ≠ 矛盾);第二
方陣的“單滿等價”
到目前為止,事情似乎進行得很順利很成功,然而,喜歡思考的讀者的腦袋瓜裏可能會冒出一個疑問:既然屬於方陣,形狀是特殊的正方形,它或許會像方方正正的君子風範一樣,具有比一般狹長形或瘦高形矩陣更好的數學品質?具體來説:作為“一對一”線性算子的方陣是否已經自動具備了“映上”的性質?或者對偶性地問:作為“映上”線性算子的方陣是否已經自動具備了“一對一”的性質?如果對於它們的回答都是“Yes, sir”,那麼逆矩陣定義中的兩個等式就可以只取其中之一,因為另一個就成為直接推論了。
答案確實是肯定的,即對方陣而言,算子性質“一對一”隱含“映上”,反之算子性質“映上”推出“一對一”。為了解釋好這兩個重要結論,我們假設讀者已經知曉線性空間的代數運算,懂得有限維線性空間的維數概念,理解任何矩陣的值域和零空間都是線性子空間,並且至少
結合之前的討論我們得知,方陣是單射(滿射)當且僅當存在同階方陣使得 = ( = )。更進一步,以上的推理論證了只對方陣有效的一個令人喜悦的真理:方陣如果是一對一的,那麼它就是映上的,因此它的逆矩陣存在唯一;方陣如果是映上的,那麼它就是一對一的,因此它的逆矩陣存在唯一。
至此,我們用高中生都學過、但許多大學生都沒有真正領會的反函數思想,證明了如下關於逆矩陣的優美定理:
定理 1 設為一行列矩陣,則如下結論成立:
非方陣“最多得其一”
上述用於方陣的定理 1 能推廣至非方陣嗎?我們先看一個實例,設矩陣有2行3列。使得 = 的矩陣必須有3行2列,這時的單位矩陣為2階的;滿足 = 的矩陣也必須有3行2列,但此時單位矩陣為3階的。我們當前要問的問題是:如果矩陣滿足等式 =
定理 2 的結論在教科書中通常是用“矩陣秩”的性質證明的。矩陣的秩一般用行列式定義:它是矩陣中不等於0的子行列式的最大階數。秩的性質包括:它不大於矩陣行數和列數之最小值;矩陣積的秩不大於每個因子的秩。在定理 2 中乘積和的秩都不大於和的最小值,而這個最小值小於和的最大值,導致結論(i)和(ii)中的等式無法成立。這裏採用算子的語言證明了定理 2,避免了對矩陣秩概念的依賴性。
自然,當 < 時,一個行列矩陣有可能與一個行列矩陣相配合,使得它們乘出一個階單位矩陣。類似地,當 > 時,一個行列矩陣有可能與一個行列矩陣相配合,
則將向量(1, −1)映到零向量,故不是一對一的,因而也不是映上的。
一般矩陣儘管沒有經典意義下的逆矩陣,數學家們總有辦法在更廣泛的意義下定義逆矩陣,稱為廣義逆矩陣,不過這將是另一篇文章的主題。
怎樣求逆矩陣?
沒有見過逆矩陣計算公式的讀者或許納悶上例中的2階逆矩陣是如何獲得的。這裏我們解析出一般2階可逆矩陣的逆矩陣公式,並據此推廣到一般的可逆矩陣。對於2階方陣
將齊次方程 = 0具體寫出兩個分量的二元一次方程組
稱為原矩陣的伴隨矩陣,記為∗,但不要理解為常用此記號的的共軛轉置。它的轉置矩陣(即第行第列元素是原矩陣的第行第列元素)的每一個元素可以這樣得到:劃去矩陣的對應位置那個元素所在的行和列,剩下一個元素,它同時也被視為該元素所定義的1行1列矩陣行列式的值,再取合適的符號:如果行指標與列指標之和為偶數,則取正號;如果行指標與列指標之和為奇數,則取負號。比如,要算出∗的第二行第一列元素,劃去的第一行第二列元素所在的行和列,剩下元素組成的1階行列式是,因為1 + 2為奇數,所以在前添一負號便得∗的第二行第一列元素−。
拉普拉斯展開
上面2階方陣的伴隨矩陣概念可以直接推廣,但需借用一般行列式的概念。階方陣的行列式||在通常的教科書中被定義為! ≡ ( − 1) ⋯ 2 ∙ 1個帶符號乘積之和,其中每個乘積的個因子取自中既不同行又不同列的元素,再賦予一個恰當的正號或負號:當這個元素依
這個行列式的定義語言看似美妙,計算過程卻很繁瑣,費時費力。好在它有其他等價定義,隨時可用,其中一個稱為行列式的拉普拉斯展開,由法國數學家拉普拉斯(Pierre- Simon Laplace,1749-1827)首次提出。它的好處是隻要定義了 − 1階方陣的行列式,就可用這一公式計算階方陣的行列式。具體做法是,給定階方陣,任取它的一行或一列,比方説第行,則
正如此行列式的3!項3個元素乘積代數和定義所得到的結果。
“花瓶”公式
現在可以推導出可求逆矩陣的逆矩陣表達式了。設為一階方陣,它的伴隨矩陣∗被定義