健康

醫保專案人次融合付費的博弈論分析

1引言

本文討論的是醫保付費中的博弈論,前提是在全民醫保的國情下,討論不同的醫保支付方式醫、患、保三方的博弈,以及醫生與院方之間的博弈。本文旨在試圖探討一種可行的思維思路或是方式方法,醫保付費改革如何才能實現從機制上引導醫生合法、合規、合理的治療疾病,只是一種初步的思考,期待引發更多的討論。

這裡要說明的是,醫生收受“紅包回扣”,醫患關係的信任與否,醫生追求自身經濟利益上的最大化,都無關乎醫生職業道德的討論,作者本人也是一名醫生,對醫生這個職業還是有種由衷的神聖與敬畏,只是為了簡明論述問題的必要,不涉及貶義。

參保人員在生病後就醫,其大部分的醫療費是由政府主導的醫保基金支付,當然居民醫保支付比例要比城鎮職工醫保要低一些,但這不是我們本文要討論的主題。然而在政府主導的醫保通常是不會做保費的“逆向選擇”的,也就是不會做保費阿克洛夫1970年《檸檬市場:質量不確定性與市場機制》筆下的“逆向選擇”。政府還是會保持較低的保費,促使全民參保,保持基本的醫療保險制度安排。

眾所周知,在醫療市場所上普遍存在不確定性和資訊的不對稱,醫療市場不確定性指的是疾病發生的不確定性,和一旦生病疾病治療效果的不確定性,從而導致參保人員在自身所患疾病時,較弱的判斷力。然而,醫生既是患者醫學知識的提供者,也是醫療服務的提供者,或許這也正是人們日常強調的,醫患關係是一種信任,一種託付。然而,在全民醫保的國情下,這種信任,這種託付就變成了醫保基金的一種負擔。醫生相對患者較完整的醫學知識,在追求自身經濟利益上最大化時,必定會讓患者支付高額的資訊租金。(阿羅《不確定性和醫療保健的福利經濟學》)

正是這種政府制度上的安排,在患者不考慮醫療費無力支付的情況下(當然,有例外,但它不是本文討論的主題),我們在現實中很容易觀察到醫生、醫院與患者之間存在利益上的一致性:醫生(院)追求費用高,費用貴的治療方案;而患者也總是追求費用高,費用貴的治療方案。

醫生(院)追求費用高,費用貴的治療方案,不難理解,因為那樣對醫生(院)的淨收益或說支付是最大化的。淨收益等於總收益減去總成本。而患者的追求則需要藉助全民醫保的國情來理解。

2按專案付費時醫生(院)與患者的博弈

通常在市場經濟的條件下,商品的價格常可以反映商品的效用,換句話說,一種商品的效用可以用該商品市場價格來衡量。在醫療市場上藥品與醫療服務一般情況下是同樣適用的,當然有例外,如長期濫用抗生素導致臨床耐藥菌珠的出現,就能說明並非貴的藥品對人體遠期效用也是最大的。但遠期的藥品與醫療服務專案的副作用,短期內是無法發現的,有時是幾年,甚或是幾十年才能發現。全民醫保的國情下,患者不再擔心自己無力承擔醫療費,加上患者並沒有多少醫學知識,在醫學上較弱的判斷力只能選擇醫生建議的治療方案。於是醫生(院)和患者就都追求費用高,費用貴的治療方案,如此,不就變成了醫保基金的負擔嗎?損害了醫保基金可持續發展。在按專案付費下,醫生(院)與患者之間的博弈,本質還是一種囚徒困境博弈。各自的最優戰略並非集體的最優選擇。

上面我們還可以看到,若通過市場方式,讓醫、患雙方自由博弈,藥品與醫療服務專案的遠期副作用,短期內無法發現。正如在重複博弈中,無限次的博弈,但很多次博弈後才發現醫生在用藥時的錯誤,損害了患者的利益,患者再來懲罰醫生(院),不再到你處就醫,這種處罰來的太晚了,對醫生的約束非常有限。從這個意義上來說,完全由競爭來解決醫、患之間的博弈是有缺陷的。

至此,我們不難發現,在全民醫保與按專案付費時,醫、患之間的相互信任與託付,變成了患者將自己的選擇權交給了醫生去選擇,可見患者參與其中很弱,基本上是缺位的,其實在其他的醫保支付方式中,患者同樣是相對缺位的。原因都在於,醫學知識的缺乏與醫療的不確定性。在博弈學中稱之為單邊囚徒困境。

為了簡明起見,假定,現有一個患者所患某一種疾病在目前的醫學技術水平下,有且僅有五種治療方案A、B、C、D、E可供選擇,且不同治療方案間其醫療費有A>B>C>D>E,這當然是為了簡明說明問題的一種理想化假設。A方案代表治療過度,短期有最大獲得感,而預期遠期的不良效用較大。B、C、D方案代表合法、合規治療,而C方案在合法、合規的基礎上還是從當前人類知曉的醫學知識來說,它是最合理的,它的預期是最佳的,既在短期有最大的獲得感,而且預期也是沒有遠期的負效用,即對於患者而言C方案是嚴格的優策略,C方案醫療費用居中,如此假設也是合乎情理的。E方案醫療費用雖說是最少的,成本亦是最小的,但代表醫療服務質量下降、缺乏或短缺,可能給患者帶來治癒時間的延長,導致誤工的延長,或是不能完全治癒的風險等。

我們也很容易理解,醫生(院)與患者在對待疾病時態度是一致的,那就是把病治好。所以在現實生活中,不存在當醫生選擇治療方案A時,患者卻選擇治療方案B、C、D或E,反之一樣,當患者選擇治療方案C時,醫生卻選擇A、B、D或E。只會出現,雙方選擇同一治療方案,不然疾病是無法治療的。於是在下面的博弈矩陣中只會存在醫生(院)選擇方案A,患者亦選擇方案A;醫生(院)選擇方案B,患者亦選擇方案B,依次類推。而其他的博弈選擇現實生活中不會出現,若出現那隻能說明患者不接受醫生的建議與治療方案,只好另選其他醫院治療,而到了其他醫院相當於重新與醫生(院)進行相類似的又一次博弈。於是,我們可以把這樣一種情況理解為,此次博弈醫生(院)收益為0,而患者的收益亦為0,這就相當於,把已患疾病的患者,沒有做任何醫療干預時的收益記為0。為了簡化論述,我們暫不考慮入內,因為無論如何均衡都不會是它。當然,不可否認,在醫療過程中由於積極地醫療干預,反而導致病情加重的情況也時有發生,如藥物過敏嚴重發生時可導致患者死亡,但人們在治療疾病的初衷是好的,這也反映了治療效果的不確定性,本文也不考慮入內(見博弈矩陣1)。

還要說明的是,作者在博弈矩陣中所列數值,數值大的代表收益越大,數值間的差異越大代表它們之間的比例越大,但並不必然存在相應的等比關係。如下面的博弈矩陣1,A 治療方案中對醫生(院)的支付為18單位,較E方案中的2單位要大,說明其收益越大,但不一定必然是E方案收益的9倍;而方案B、C、D是的12單位,10單位和8單位代表它們之間的收益相對不是太大,但較方案A其收益明顯要小,又較方案E其收益明顯要大。同理在患者的支付中,“數字”代表與醫生(院)相同。但在患者的收益中出現“-、+”,“-、+”代表短期或長期收益可預期的比較,如長期濫用抗生素,遠期存在導致臨床耐藥菌珠出現的風險。如在A方案中,患者的收益是10-代表遠期預期存在不良風險,而短期自我感覺與C治療方案相同,而C方案中20+就代表從目前醫生所掌握的醫學知識而言,無論是近期還是遠期其綜合收益都是最佳的。再者,醫生的收益與患者的收益之間其數值不存在必然的某種聯絡,如在C治療方案中出現醫生收益為10個單位,而患者收益為20+個單位,只是通常認為醫生的收益可用貨幣形式來度量,與患者治療好疾病所獲得的無法用貨幣形式來度量的效用相比要小的多。還有,醫療費對於醫生來說是收益,而對患者來說就是成本。

對已患疾病的患者,其治療疾病的效用問題或博弈學中的收益支付問題。本文的界定是,對於一個已患某種疾病的患者的收益包含更為廣泛的成本與收益。有表現為可用貨幣支付的,如就醫時來回的路費以及就醫的醫療費等;有表現在時間上的,如疾病治療痊癒的時間長短,或者說是推遲或縮短了痊癒的時間;也有表現在死亡與痊癒,痊癒與部分痊癒,傷殘與部分傷殘,臨床症狀的緩解與部分緩解,治療過程中副作用的大與小,還包含遠期的不良風險的大與小,如長期使用抗生素導致耐藥菌珠的出現,患者可能在將來的某一天會為所患疾病治癒支付更高的醫療費和治療更長的時間,甚或因此而不治身亡等;甚至還包括患者的良好就醫體驗與滿足。任何一種治療方案相對另一種治療方案,對患者綜合有益性的提高,本文都算作是對患者更高的支付,反之則相反。

考慮到醫保會為患者支付大部分的醫療費用,亦即患者把大部分的成本轉嫁給了醫保,但對於整個社會而言,這部分的成本是不可忽略的。於是我們把醫療費的成本亦加入到患者的收益中。(見博弈矩陣1)

博弈矩陣1

那麼這個博弈其均衡在那裡?從單邊囚徒困境博弈不難理解,當然就在A治療方案。因為A治療方案醫生(院)收益最大,而上文已提到因患者較弱的判斷力,把自身的選擇權交給醫生,醫生單方面決策就當然是A治療方案了。然而,這就是全民醫保下的按專案付費醫、患博弈。

然而,在按專案付費時,醫保此博弈中也像是缺位了,就像是沒有參與其中,還促使了患者選擇A治療方案。所以,醫保必須參與其中,醫保通過改革付費方式進入。

總額控制下的專案付費博弈,在均次費用指標以內,與按專案付費博弈相同。超出均次費用指標時,醫保也只是相當於僅對次均費用超出指標的部分對醫院給予處罰,處罰過小時醫院當然不會重視,從博弈學的角度看,均次費用超支就是必然的結果。

3按人頭付費與DRGs付費時醫生與患者的博弈

大家知道,按人頭付費與DRGs付費其最大的特點就是:從市場角度出發制定的“超支完全自理、結餘完全歸已”的簡單遊戲規則,術語就是醫生和醫院享有剩餘索取權和控制權。也就是在按人頭或是按診斷制定定額付費後,醫生(院)最大限度的控制成本,就可以最大限度地保留結餘留用。從而我們可以看出,這種付費方式下與按專案付費對比,醫生(院)在追求最大收益時,完全相反的兩種不同行為方式。一個追求費用高,費用貴的治療方案才能獲得最大收益;而另一個追求費用低,費用便宜的治療方案,才能保留更多結餘,收益才能最大化。上文也已說明由於患者不完全的醫學知識,以及治療疾病效果的不確定性決定了患者對此較弱的判斷力,加上患者對醫生(院)的信任,會託付給醫生對此進行選擇。於是醫生(院)從自身利益出發,必定選擇費用低,費用便宜的治療方案。也正因為患者在此事件上較弱的判斷力,也易導致患者不易發現自己其實早已被“騙”,還被燜在鼓裡。很長時間後才發現(或是根本就沒有發現),患者再來懲罰醫生(院),不再到你處就醫,這種處罰來的太晚了些,對醫生的約束非常有限。

這裡要說明的是,下面博弈矩陣所列數值與按專案付費時醫生(院)與患者間的博弈矩陣所列數值相反,僅表示醫生(院)收益確實是倒了過來,但並不表示必然存在與真實生活中收益剛好一一對應,如A方案在按人頭付費或DRGs付費時其收益在現實生活中剛好就變成2單位,與在按專案付費時收益相同。作者只是為了簡明直觀地說明問題,形成一個強烈的對比而已,則有博弈矩陣2。

博弈矩陣2

那麼這個博弈其均衡又在那裡?同樣從單邊囚徒困境博弈不難理解,當然就在E治療方案。因為E治療方案醫生收益最大,也是因患者較弱的判斷力,把自身的選擇權交給醫生(院),醫生(院)單方面決策就當然是E治療方案了。然而,在統籌區內都是在門診時都按人頭付費,而住院時採用DRGs付費,無論患者走到哪個醫院,醫生(院)從自身利益出發對該疾病的治療方案向患者宣教時就都均是E方案,而患者的醫學知識絕大是來自醫生的傳播,還就真有可能不知道其實在當前醫學界對該疾病還存在A、B、C、D其它四種治療方案。

所以,這也可以理解,為什麼門診按人頭付費需要市場給予供給配套?讓患者用腳投票的方式來促進醫生(院)保證醫療服務質量。這就像設制了重複博弈,一旦患者發現自己被“騙”,患者有權下一次不再去你處就診。但這種監督可能會來的太遲了些,也就來的太弱了些。

從上述分析可見,不論是按專案付費,還是門診按人頭付費或住院按DRGs付費,醫院與醫保間的博弈不存在醫療資源配置帕累托最優的均衡解(王鑑崗,《醫療費用世界難題最優解的博弈論分析》社會保障2010年第1期)。亦即其均衡都不會出現在對所患疾病最優治療的C方案上。

如何才能使這種博弈的均衡出現在C治療方案上?那麼我們該通過什麼方式或方法改變這種博弈的結果呢?實現它的路徑在哪裡?

要改變這種博弈的結果,從經濟學委託-代理理論出發,風險與激勵是矛盾的。但深入研究經濟學委託-代理理論,從經濟學委託-代理理論本質出發,就很快會發現,若要使代理人的行動方案與委託人預期目標一致,首要且關鍵的措施就是要消除在各種不同方案選擇間,給代理人帶來的收益差距,之後再逐步分階段加強對代理人激勵,也許同樣會出現一個最優激勵。亦即其關鍵步驟是運用管理措施改變醫生的思維方式:以經濟利益為中心,改為以疾病治療為中心。這種管理措施又在哪呢?

4專案人次融合付費時醫患博弈

4.1醫生與患者的博弈。要把醫生的思維方式從以經濟利益為中心,改為以疾病為中心,要分三步走。

第一步,首先要利用醫保管理措施,消除醫生經濟利益上的思維牽制。即無論醫生(院)選擇哪種治療方案都沒有收益上的差距,經濟上的好與壞。變成如下博弈矩陣3。

博弈矩陣3

這一步的實現,有待於專案人次融合付費中設制的成本與利潤引數a與b,出現按專案付“成本”,而人次付“利潤”。如此轉變極其關鍵,因為對醫生來說,淨收益的來源將且僅將來自於人次的博弈,而非專案的博弈。其具體操作方式和機制詳見作者的《醫保總控指標的調適》,《醫保專案人次融合付費》和《醫保專案人次融合付費剋星過度醫療》等文。

第二步,我們再在上述基礎上,若選擇A治療方案對醫生(院)進行懲罰,也就是均次費用超出1.1M標時,醫保與醫院共同分擔。另一方面,又對治療方案B、C、D進行獎勵,其表現在對0.7M標-M標進行累計獎勵百分率x、y、z上。則出現下列博弈矩陣4。

博弈矩陣4

從上述的博弈矩陣中可以清楚地看到,這個博弈從醫生的經濟收益角度出發,其均衡既不在A 治療方案,也不在E治療方案。因為A、E治療方案醫生(院)收益較小,而在於治療方案中的B、C或D任何一種。然而,既然醫生(院)不會選擇治療方案A或者E,不正好達到了醫保首要目標,既控費,又保證醫療服務質量嗎?

第三步,接下來又該如何做才能促使這個博弈的均衡會出現在醫生選擇C治療方案呢?排除了經濟上的利益對醫生思維的牽制後,再讓患者用腳投票的方式來促進醫生提高醫療服務質量,若醫生非常注重自己的聲譽,醫生職業道德的弘揚,又非常想擴大自身的醫術在群眾中的名氣,擴大市場。儘自己傾其所學醫學知識,最大限度地換位思考,以疾病為中心去思考如何治療疾病就有可能促使這個博弈的均衡出現在C治療方案上。

4.2醫生與醫院的博弈。上文我們分析了,讓患者用腳投票的方式,促使醫生提高醫療服務質量,其監督的力量來的是那樣的遲,又是那樣的弱。那有沒有更強一些的力量來監督醫生的行為,促使醫生以疾病為中心呢?那就是院方的監督。

在作者看來,醫生與醫院之間的博弈,著眼點主要看醫生在收受“紅包回扣”時,與醫院收益的關係。

我們先來看一下按專案付費下醫生與院方的博弈。從博弈矩陣1上看,醫生追求“紅包回扣”必定會使醫療費用升高,也就相當於均衡應在A 治療方案上,而A 治療方案也可誘導醫院收益的增加,所以在按專案付費下對醫生與醫院的利益導向有一致性。

相反,從博弈矩陣2上可以看出,在按人頭付費或DRGs付費時,其對醫生與醫院的利益導向有完全對立性。確切地說,就是醫生在追求“紅包回扣”時與醫院的利益上有著不可調和性。正是這種不可調和性,當醫院追求利益最大化時,就必須監督醫生選擇治療方案E,於是便實現了院方監督醫生不要去追求“紅包回扣”。

而專案人次融合付費有類似於按人頭付費或DRGs付費時實現了院方監督醫生不要去追求“紅包回扣”的功能。只要對A方案醫保對醫院的懲罰足夠大,醫院追求利益最大化時,就必須監督醫生選擇治療方案B、C、D,而不是A或E。當醫院追求醫院的利益最大化時就必須擴大市場,增加服務人次數,這樣又必將引導醫院追求注重醫院自身的聲譽,而當一個醫院追求注重醫院自身聲譽的時候,就必須監督醫生選擇治療方案C,而不是治療方案B或D。從而形成一個良性的迴圈。當然,我們還可以對若選擇治療方案B時少獎勵一些,便能進一步促使醫院監督醫生選擇C治療方案,這便涉及到對引數的綜合調整(成本與利潤引數a、b,0.7M標-M標累計獎勵百分率x、y、z和均次費用對次年均次費用指標的權重L)。如此,當醫生選擇治療方案B時比選擇治療方案C時,醫院收益反而相對少了一些。

當然,在現實生活中,由於疾病治療的複雜性和治療效果的不確定性,不同的醫生對同一患者同一種疾病的治療見解也是仁者見仁,智者見智。為此,本文只是強調醫生本人應當傾其所學醫學知識,盡心盡力以疾病為中心治療,強調的是治療結果。

所以保留患者用腳投票方式,一方面監督了醫生,另一方面也監督了醫院,也促使了醫院去監督了醫生,為此,它是促進醫生提高醫療服務質量的有益之選。並期待在刨除了醫生經濟利益上的思維牽制後,這種患者用腳投票的方式對醫生的監督會來得更有力一些,合法、合規、合理的醫治才有望實現。

至此,我們可以清楚地看到,在這樣的醫保管理措施下,C 治療方案就成了一個精煉貝葉斯納什均衡。

4.3專案人次融合付費引數a、b的效率選擇。從博弈論的角度出發,如果我們給定方案C是醫生的“真話”的話,那其他四個方案就是不同情景下醫生(院)的“假話”。根據不同的醫保支付方式,理性經濟人醫生從自身利益最大化出發,而說的不同的“假話”。我們就不難理解,設定a、b引數,使醫療服務“成本”與“利潤”作一個基本劃分,並非一定要多少精確,只要能夠切斷醫院按專案付費時因增加服務專案而獲得超額利潤的可能,轉化為以增加人次,才能增加利潤的方式探索,必定是促使醫生(院)說真話的必要步驟或措施。結合博弈論中多重博弈,“聲譽”機制,人們群眾的“聯合抵制”機制等的配合,才渴望醫生(院)會說“真話”。

容易理解,假定,我們已給定了某醫院的住院均次費用,此住院均次費用應當與當前社會經濟發展與承載相適應,或說與治療方案C的當前社會醫療服務價值相當;並給定引數a、b值使得醫保給付的費用其成本與利潤劃分,也與治療方案C的當前社會成本與利潤相當。在此情形下,如果醫生說謊,選擇治療方案B或者D,對醫生不會帶來任何額外的收益,相反,還可能帶來聲譽的損害,帶來人們群眾“聯合抵制”的風險。為此,患者的就醫體驗就可能重視起來。

再者,結合作者《醫保總控指標的調適》《醫保專案人次融合付費》以及《專案人次融合付費剋星過度醫療》等文相關章節的討論,不難看出,當a=1、b=0時,專案人次融合付費就成了按專案付費;當a=0、b=1時,它就類似於DRGs付費,這分別是兩個相對的極端情況。所以,無論引數a與b如何設定,只要不設定a=1、b=0或a=0、b=1時(嚴格的來說是:設定a、b值達到醫院所能控制的極限成本之內時),專案人次融合付費相對於按專案付費與DRGs付費就是一種改進,一種卡爾多-希克斯效率的改進,增加社會總財富的變革。從而也可以看出,不同的a、b值就將產生不同的資源配置,也將帶來不同效益的資源配置。

當且僅當,在設定引數a、b的值,使得醫療服務“成本”與“利潤”的劃分與治療方案C的當前社會“成本”與“利潤”相等時,將達到帕累托最優效率。然而,由於疾病的複雜性和治療效果的不確定性,導致我們在設定引數a、b的值時,很難達到如此的精準狀態。更何況一家醫院並非只治療一種疾病,它是一個能夠生產多種“產品”的超級工廠,所以,我們設定的引數a、b值是所有統籌區內醫院在治療所有疾病時的社會綜合“成本”與“利潤”的比例,那它將是更難實現“精準狀態”。

設定引數a、b不同的值,它雖不是帕累託改進,但它明顯可以增加社會總福利,可促使醫生說“真話”。因為相對按專案付費與DRGs付費,專案人次融合付費對醫生的收益有不增反降的可能,但患者受益明顯,將遠大於醫生的損失。從社會整體而言,有益而無害。在此情況下,如何補償醫生的損失,達到帕累託改進,由於補償標準的難於確定性,如何補償還有待進一步的研究探討。

相反,當我們給定了均次費用指標,此均次費用指標是根據當前社會經濟發展與承載來確定的;也給定了醫保各專案的支付標準,此支付標準亦與當前社會價值相一致;同時,也設定了a、b引數,使醫療服務“成本”與“利潤”的劃分,吻合當前社會醫療服務價值“成本”與“利潤”的基本狀態比例,那便是強力指引醫生(院)選擇最優方案治療的“燈塔”。醫生不一定嚴格選擇標準的臨床路徑來治療此種疾病,但必定在此疾病標準臨床路徑的附近進行治療。所以嚴格合理的均次費用指標,科學的制定醫保各專案的支付標準,以及與當前社會醫療服務價值“成本”與“利潤”相適應的引數a、b值,三者將是專案人次融合付費指引醫生選擇標準臨床路徑治療的關鍵。所以,當三者同時滿足合理時,醫生對患者的治療過程就會有一個相對質量的保證。

至此,我們可以發現設定引數a、b只是關乎提高社會效率的選擇,不同的a、b值就將產生不同的資源配置,也將帶來不同效益的資源配置。增加部分的社會福利它無法達到公平分配,所以它們與公平無關。它們是在資訊不對稱和醫療服務效果不確定的情景下,改善社會效率的有益探索,更重要的是,它是促使醫生說“真話”的必要步驟。

5小結

以具體醫療行為干預為主的DRGs模式不僅成本巨大,卻收效不足,暴露出醫療行為干預為主的合理化手段存在侷限性。

綜上分析,從博弈學的角度出發,專案人次融合付費是作者提出的一種醫保付費方式理想博弈模型,在制定醫保付費方式時,促使醫生的思維以經濟利益為中心,轉化為以疾病治療為中心,保留患者用腳投票的權力,還可促使院方努力監督醫生的醫治行為,也許會是解決醫生選擇合法、合規、合理地醫治疾病一種有益的探索,若有可能還可促使以疾病治療為中心,進一步轉化為以患者就醫體驗為中心。

可見,專案人次融合付費方式的設計已涉及規制經濟學中資訊不對稱所引發的外部不經濟規制設計的核心問題,如何設計一種有效的激勵性規制,制定出適當的規制規則和規制政策,使醫生(院)感受到約束的同時,還有足夠的動力去追求與醫保規制政策一致的目標。專案人次融合付費與當前醫保付費各支付方式相比,更符合規制經濟學激勵性規制要求。並期待今後會有更有效,更高效地醫保付費方式,促使醫生在治療疾病時,以疾病為中心,而不是以自我經濟利益為中心的思維方式,從而促使醫生選擇合法、合規、合理地醫治患者,達到與醫保政策一致的目標。

本文轉載自其他網站,不代表健康界觀點和立場。如有內容和圖片的著作權異議,請及時聯絡我們(郵箱:[email protected]

Reference:健康生活

看更多!請加入我們的粉絲團

轉載請附文章網址

不可錯過的話題