Teori permainan (bahasa Inggris: game theory) adalah bagian dari ilmu matematika yang mempelajari interaksi antar agen yang bersifat rasional. Setiap keputusan atau strategi yang dipilih oleh agen akan memiliki hasil yang berbeda (payoff) pada agen kompetitor. Pertama kali dikembangkan sebagai cabang tersendiri dari ilmu matematika oleh Oskar Morgenstern dan John von Neumann, cabang ilmu ini telah berkembang sedemikian pesat hingga melahirkan banyak tokoh peraih nobel, seperti John Nash (AS), Reinhard Selten (Jerman), dan John Harsanyi (AS) pada tahun 1999 dan Thomas Schelling (AS), Robert Aumann (Israel) pada tahun 2005, dan Leonid Hurwicz (Amerika Serikat) pada tahun 2007.
Permodelan
Teori permainan paling mudah biasanya dimodelkan dalam bentuk matriks payoff atau pohon keputusan. Pada dasarnya,
Teori permainan diasumsikan semua agen bersifat rasional. Rasionalitas yang dimaksud adalah dimana setiap agen diasumsikan memutuskan strategi untuk memaksimalkan payoff dari agen itu sendiri yang tergantung pada pengetahuan dari agen terhadap strategi kompetitor. Variabel-variabel yang diformulasikan pada
Teori permainan mencakup keputusan (strategi) dari setiap agen dan payoff yang berupa hasil dari pengambilan keputusan tersebut. Apabila digambarkan pada agen
A
{\displaystyle A}
dan
B
{\displaystyle B}
, maka agen
A
{\displaystyle A}
dapat memiliki strategi
S
1
A
{\displaystyle S_{1}^{A}}
,
S
2
A
{\displaystyle S_{2}^{A}}
, ..., sampai
S
n
A
{\displaystyle S_{n}^{A}}
dan agen
B
{\displaystyle B}
memiliki strategi
S
1
B
{\displaystyle S_{1}^{B}}
,
S
2
B
{\displaystyle S_{2}^{B}}
, ..., sampai
S
m
B
{\displaystyle S_{m}^{B}}
. Kemungkinan hasil atau payoff yang diperoleh agen
A
{\displaystyle A}
dan
B
{\displaystyle B}
dapat berjumlah
n
×
m
{\displaystyle n\times m}
. Diketahui bahwa agen
A
{\displaystyle A}
dan agen
B
{\displaystyle B}
memiliki Payoff berupa
f
A
(
S
n
A
,
S
m
B
)
{\displaystyle f_{A}(S_{n}^{A},S_{m}^{B})}
dan
f
B
(
S
m
B
,
S
n
A
)
{\displaystyle f_{B}(S_{m}^{B},S_{n}^{A})}
.
f
A
(
S
n
A
,
S
m
B
)
{\displaystyle f_{A}(S_{n}^{A},S_{m}^{B})}
adalah fungsi payoff dari agen
A
{\displaystyle A}
mempertimbangkan strategi Agen
A
{\displaystyle A}
(
S
n
A
{\displaystyle S_{n}^{A}}
) yang ke
n
{\displaystyle n}
dan strategi Agen
B
{\displaystyle B}
(
S
m
B
{\displaystyle S_{m}^{B}}
) yang ke
m
{\displaystyle m}
. Tabel matriks payoff dari agen
A
{\displaystyle A}
dan
B
{\displaystyle B}
adalah sebagai berikut:
Penyelesaian atau solusi dari permasalahan ini disebut ini keseimbangan Nash (Nash Equilibrium) apabila setiap agen sudah mencapai payoff maksimum tergantung dari strategi agen lain dan seluruh agen tidak dapat lagi merubah strateginya. Keseimbangan Nash ditemukan oleh John Forbes Nash Jr. dalam studinya yang berjudul Noncooperative games. Sebagai contoh, permasalahan dilema tahanan (prisoner's dilemma) adalah penerapan
Teori permainan untuk dua tahanan yang sedang diinterogasi. Tahanan
A
{\displaystyle A}
dan
B
{\displaystyle B}
ditangkap karena kejahatan yang dilakukan mereka secara bersamaan oleh penegak hukum. Setiap tahanan yang diinterogasi memiliki dua strategi yaitu mengakui kejahatannya atau tidak. Payoff dari kedua tahanan ini adalah lama tahanan akan dipenjara. Setiap strategi yang dilakukan akan menghasilkan payoff yang berbeda-beda untuk setiap Tahanan. Jika dimodelkan dengan matriks payoff, strategi dan payoff kedua tahanan adalah berikut ini:
Contoh matriks payoff menunjukan efek dari penetapan setiap strategi tahanan
A
{\displaystyle A}
dan
B
{\displaystyle B}
terhadap lama mereka akan dipenjara. Sebagai contoh, Jika tahanan
A
{\displaystyle A}
mengakui perbuatannya dan tahanan
B
{\displaystyle B}
tidak, maka tahanan
A
{\displaystyle A}
akan bebas dan tahanan
B
{\displaystyle B}
dipenjara selama 5 tahun. Berdasar dari konsep keseimbangan Nash, jika tahanan
B
{\displaystyle B}
memilih mengaku, maka respon terbaik tahanan
A
{\displaystyle A}
adalah juga mengakui perbuatannya. Jika tahanan
B
{\displaystyle B}
memilih untuk tidak mengakui, respon terbaik tahanan
A
{\displaystyle A}
adalah masih mengakui perbuatannya. Apapun strategi yang dipilih tahanan
B
{\displaystyle B}
, tahanan
A
{\displaystyle A}
sebaiknya memilih untuk mengakui perbuatannya. Hal ini pun juga berlaku untuk tahanan
B
{\displaystyle B}
. Jika tahanan
A
{\displaystyle A}
memilih mengaku, maka respon terbaik tahanan
B
{\displaystyle B}
adalah juga mengakui perbuatannya. Jika tahanan
A
{\displaystyle A}
memilih untuk tidak mengakui, respon terbaik tahanan
B
{\displaystyle B}
adalah masih mengakui perbuatannya. Alhasil, kedua tahanan akan memilih untuk mengakui perbuatannya. Hal ini disebut keseimbangan Nash dimana kedua tahanan yang sudah mengaku tidak lagi dapat memperbaharui strateginya. Akhirnya kedua tahanan memiliki payoff berupa dipenjara selama 3 tahun. Kondisi
permainan yang dilakukan juga termasuk kedalam
permainan nonkooperatif (Noncooperative game), dimana semua agen rasional berkompetisi tanpa ada interaksi antar mereka. Jika kedua tahanan memilih untuk berinteraksi, maka satu-satunya payoff paling optimal diperoleh jika keduanya tidak mengaku. Mereka akan hanya dipenjara selama satu tahun. Skema interaksi ini dinamakan
permainan kooperatif (Cooperative game).
Selain dimodelkan dengan matriks payoff,
permainan dapat dimodelkan dengan menggunakan pohon keputusan (Decision tree). Penggunaan pohon keputusan dalam
Teori permainan dapat merujuk kepada
permainan sekuensial (Sequential game) dan
permainan extensive form. Jika diaplikasikan pada
permainan dilema tahanan, strategi tahanan
A
{\displaystyle A}
yang dari tahanan
B
{\displaystyle B}
dapat dilihat pada gambar pohon keputusan.
Penerapan Teori permainan dalam pemodelan ekonomi
Pemodelan kompetisi antar agen dari
Teori permainan dan penyelesaian solusinya berupa keseimbangan Nash memberikan beberapa dampak pada berbagai sektor kehidupan masyarakat. Salah satunya adalah dalam pemodelan ekonomi. Beberapa model yang terdampak adalah model kuantitas Cournot, model penetapan harga Bertrand, dan model kepemimpinan Stackelberg.
= Model kuantitas Cournot
=
Pada 1838, matematikawan dan ekonom prancis yang bernama Antoine Augustin Cournot, menerbitkan sebuah publikasi dengan judul Recherches sur les principes mathématiques de la Théorie des richesses. Publikasinya menjelaskan bahwa terdapat persaingan antar perusahaan dalam hal kuantitas produksi sebuah barang. Keputusan antar perusahaan sifatnya independen namun rasional. Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelan Cournot:
Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagi informasi (Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang seimbang, sehingga mereka menetapkan keputusannnya secara simultan (Simultaneous).
Semua perusahaan berkompetisi untuk menghasilkan kuantitas produk yang cukup dan jumlah kuantitas produk mempengaruhi harga.
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, atau payoff mereka.
Berdasar pada hubungan penawaran dan permintaan (supply and demand), model Cournot fokus pada fungsi permintaan dimana kenaikan jumlah kuantitas yang diproduksi akan menurunkan harga dari produk itu. Sebagai contoh jika perusahaan
A
{\displaystyle A}
berkompetisi kuantitas dengan perusahaan
B
{\displaystyle B}
. Perusahaan
A
{\displaystyle A}
menghasilkan produk sebesar
q
A
{\displaystyle q_{A}}
unit dan perusahaan
B
{\displaystyle B}
menghasilkan produk sebesar
q
B
{\displaystyle q_{B}}
unit. Jumlah kuantitas produk digambarkan pada fungsi
Q
=
q
A
+
q
B
{\displaystyle Q=q_{A}+q_{B}}
. Karena harga dipengaruhi oleh kuantitas produk pada model ini, maka fungsi harga digambarkan pada persamaan berikut:
p
(
Q
)
=
a
−
b
×
Q
p
(
q
A
,
q
B
)
=
a
−
b
×
(
q
A
+
q
B
)
{\displaystyle {\begin{aligned}p(Q)&=a-b\times Q\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\end{aligned}}}
Model penetapan harga diatas menjelaskan bahwa setiap harga
p
(
Q
)
{\displaystyle p(Q)}
atau
p
(
q
A
,
q
B
)
{\displaystyle p(q_{A},q_{B})}
sangat bergantung terhadap jumlah kuantitas
Q
{\displaystyle Q}
unit dari
q
A
{\displaystyle q_{A}}
dan
q
B
{\displaystyle q_{B}}
. Parameter
a
{\displaystyle a}
adalah nilai intercept dari sebuah model ekonometrika yang menjelaskan kesediaan pasar untuk membayar jika produk sama sekali tidak tersedia. Parameter
b
{\displaystyle b}
adalah nilai slope yang menunjukan besar pengaruh kuantitas terhadap perubahan harga. Parameter ini juga dapat dikatakan sebagai elastisitas harga dengan satuan
harga
unit
{\textstyle {\frac {\text{harga}}{\text{unit}}}}
. Model harga ini juga terkenal dengan sebutan fungsi permintaan terbalik (inverse demand function). Fungsi ini dipakai kembali pada penetapan model pendapatan (revenue) untuk perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
.
π
A
(
q
A
,
q
B
)
=
p
(
q
A
,
q
B
)
×
q
A
=
[
a
−
b
×
(
q
A
+
q
B
)
]
×
q
A
π
B
(
q
B
,
q
A
)
=
p
(
q
A
,
q
B
)
×
q
B
=
[
a
−
b
×
(
q
A
+
q
B
)
]
×
q
B
{\displaystyle {\begin{aligned}\pi _{A}(q_{A},q_{B})&=p(q_{A},q_{B})\times q_{A}\\&=[a-b\times (q_{A}+q_{B})]\times q_{A}\\\pi _{B}(q_{B},q_{A})&=p(q_{A},q_{B})\times q_{B}\\&=[a-b\times (q_{A}+q_{B})]\times q_{B}\end{aligned}}}
Perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
akan menerima pendapatan sebesar
π
A
{\displaystyle \pi _{A}}
dan
π
B
{\displaystyle \pi _{B}}
. Pendapatannya berupa jumlah harga yang ditetapkan (
p
(
q
A
,
q
B
)
{\displaystyle p(q_{A},q_{B})}
) dikalikan dengan kuantitas produksi dari masing masing perusahaan (
q
A
{\displaystyle q_{A}}
dan
q
B
{\displaystyle q_{B}}
). Karena fungsi pendapatan dari perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
berbentuk model ordo kedua (second-order), maka kedua model diasumsikan memiliki bentuk concave. Untuk menemukan titik optimum global, kedua fungsi pendapatan diturunkan. Kondisi ordo pertama dari model pendapatan adalah:
d
π
A
(
q
A
,
q
B
)
d
q
A
=
a
−
b
(
2
q
A
+
q
b
)
=
0
d
π
B
(
q
B
,
q
A
)
d
q
B
=
a
−
b
(
q
A
+
2
q
b
)
=
0
{\displaystyle {\begin{aligned}{d\pi _{A}(q_{A},q_{B}) \over dq_{A}}&=a-b(2q_{A}+q_{b})=0\\{d\pi _{B}(q_{B},q_{A}) \over dq_{B}}&=a-b(q_{A}+2q_{b})=0\\\end{aligned}}}
Dari turunan model pendapatan perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
, respon terbaik (best response function) dari setiap perusahaan untuk menghasilkan kuantitas produk dapat diperoleh. Dalam
Teori permainan, respon terbaik adalah strategi terbaik yang ditentukan oleh agen itu sendiri yang tergantung pada strategi dari kompetitor. Fungsi dari respon terbaik setiap perusahaan merupakan modifikasi dari turunan model pendapatan. Fungsi perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
adalah sebagai berikut:
a
−
b
(
2
q
A
+
q
b
)
=
0
q
A
=
a
−
b
×
q
B
2
b
a
−
b
(
q
A
+
2
q
B
)
=
0
q
B
=
a
−
b
×
q
A
2
b
{\displaystyle {\begin{aligned}a-b(2q_{A}+q_{b})&=0\\q_{A}&={\frac {a-b\times q_{B}}{2b}}\\a-b(q_{A}+2q_{B})&=0\\q_{B}&={\frac {a-b\times q_{A}}{2b}}\end{aligned}}}
Setelah menemukan respon terbaik dari setiap perusahaan untuk memaksimalkan pendapatannya, hasil keseimbangan Nash pada model Cournot dapat ditemukan melalui persamaan respon terbaik dari
q
A
{\displaystyle q_{A}}
dan
q
B
{\displaystyle q_{B}}
atau dari
d
π
A
(
q
A
,
q
B
)
d
q
A
=
d
π
B
(
q
B
,
q
A
)
d
q
B
=
0
{\textstyle {\frac {d\pi _{A}(q_{A},q_{B})}{dq_{A}}}={\frac {d\pi _{B}(q_{B},q_{A})}{dq_{B}}}=0}
. Dengan mensubsitusi fungsi
q
A
{\displaystyle q_{A}}
pada fungsi
q
B
{\displaystyle q_{B}}
, keseimbangan Cournot Nash ditemukan pada:
q
B
=
a
−
b
×
q
A
2
b
=
a
−
b
×
(
a
−
b
×
q
B
2
b
)
2
b
=
a
3
b
q
A
=
a
−
b
×
q
B
2
b
=
a
−
b
×
(
a
3
b
)
2
b
=
a
3
b
{\displaystyle {\begin{aligned}q_{B}&={\frac {a-b\times q_{A}}{2b}}\\&={\frac {a-b\times ({\frac {a-b\times q_{B}}{2b}})}{2b}}\\&={\frac {a}{3b}}\\q_{A}&={\frac {a-b\times q_{B}}{2b}}\\&={\frac {a-b\times ({\frac {a}{3b}})}{2b}}\\&={\frac {a}{3b}}\end{aligned}}}
Jadi perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
akan mencoba untuk memproduksi
q
A
{\displaystyle q_{A}}
dan
q
B
{\displaystyle q_{B}}
produk sebesar
a
3
b
{\textstyle {\frac {a}{3b}}}
unit. Berdasar keputusan yang sudah seimbang, keluarannya adalah sebagai berikut:
Q
=
q
A
+
q
B
=
a
3
b
+
a
3
b
=
2
a
3
b
p
(
q
A
,
q
B
)
=
a
−
b
×
(
q
A
+
q
B
)
=
a
−
b
(
2
a
3
b
)
=
a
3
π
A
=
π
B
p
(
q
A
,
q
B
)
×
q
A
=
p
(
q
A
,
q
B
)
×
q
B
=
a
3
×
a
3
b
=
a
2
9
b
{\displaystyle {\begin{aligned}Q&=q_{A}+q_{B}&\\&={\frac {a}{3b}}+{\frac {a}{3b}}\\&={\frac {2a}{3b}}\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\\&=a-b({\frac {2a}{3b}})\\&={\frac {a}{3}}\\\pi _{A}&=\pi _{B}\\p(q_{A},q_{B})\times q_{A}&=p(q_{A},q_{B})\times q_{B}\\&={\frac {a}{3}}\times {\frac {a}{3b}}\\&={\frac {a^{2}}{9b}}\end{aligned}}}
Permodelan Cournot yang dilakukan tentunya cukup terbatas. Apabila diterapkan model keuntungan (profit) dengan nilai biaya (cost) yang berbeda akan menghasilkan perspektif keseimbangan yang berbeda juga.
= Model Penetapan Harga Bertrand
=
Pada tahun 1883, matematikawan dan ekonom prancis yang bernama Joseph Louis François Bertrand, mengkritisi model Cournot dalam publikasinya yang berjudul Book Review of “Théorie Mathématique de la Richesse Social” and of “Recherches sur les Principes Mathématique de la Theorie des Richesses yang diterbitkan di Journal des savants. Bertrand mengkritisi model kuantitas Cournot bahwa perusahaan-perusahaan lebih memiliki kompetisi dalam hal perang harga. Penetapan harga tentunya baru akan memperngaruhi kuantitas produksi. Keputusan antar perusahaan sifatnya masih independen dan rasional seperti model Cournot. Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelan Bertrand:
Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagi informasi (Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang seimbang, sehingga mereka menetapkan keputusannnya secara simultan (Simultaneous).
Semua perusahaan berkompetisi untuk menetapkan harga yang tepat dan harga produk mempengaruhi kuantitas produksi.
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, atau payoff mereka.
Pola permintaan sangat dipengaruhi oleh keputusan harga setiap perusahaan yang berkompetisi.
Poin 1, 2, 3, 4,dan 6 sama seperti model Cournot, yang membedakan model Bertrand dengan Cournot adalah pada poin 5 dan 7. Berdasar pada hubungan penawaran dan permintaan (supply and demand), model Bertrand fokus pada fungsi permintaan dimana kenaikan harga akan permintaan (demand) dari produk itu. Sebagai contoh jika perusahaan
A
{\displaystyle A}
berkompetisi harga dengan perusahaan
B
{\displaystyle B}
. Perusahaan
A
{\displaystyle A}
menetapkan harga produk sebesar
P
A
{\displaystyle P_{A}}
dan perusahaan
B
{\displaystyle B}
menetapkan harga produk sebesar
P
B
{\displaystyle P_{B}}
. Jumlah kuantitas produk digambarkan pada fungsi
Q
=
D
A
(
P
A
,
P
B
)
+
D
B
(
P
B
,
P
A
)
{\displaystyle Q=D_{A}(P_{A},P_{B})+D_{B}(P_{B},P_{A})}
dimana kuantitas produk akan sama dengan total permintaan pada perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
. Permintaan pada perusahaan
A
{\displaystyle A}
(
D
A
{\displaystyle D_{A}}
) akan dipengaruhi oleh penetapan harga perusahaan
A
{\displaystyle A}
itu sendiri (
P
A
{\displaystyle P_{A}}
) dan harga dari kompetitor (
P
B
{\displaystyle P_{B}}
). Permintaan pada perusahaan
B
{\displaystyle B}
(
D
B
{\displaystyle D_{B}}
) akan dipengaruhi oleh penetapan harga perusahaan
B
{\displaystyle B}
itu sendiri (
P
B
{\displaystyle P_{B}}
) dan harga dari kompetitor (
P
A
{\displaystyle P_{A}}
). Model permintaan ini juga terkenal dengan sebutan fungsi permintaan (demand function). Fungsi ini dipakai pada penetapan model pendapatan (revenue) untuk perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
.
π
A
(
P
A
,
P
B
)
=
P
A
×
D
A
(
P
A
,
P
B
)
π
B
(
P
B
,
P
A
)
=
P
B
×
D
B
(
P
B
,
P
A
)
{\displaystyle {\begin{aligned}\pi _{A}(P_{A},P_{B})&=P_{A}\times D_{A}(P_{A},P_{B})\\\pi _{B}(P_{B},P_{A})&=P_{B}\times D_{B}(P_{B},P_{A})\end{aligned}}}
Sama seperti model Cournot, perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
akan menerima pendapatan sebesar
π
A
{\displaystyle \pi _{A}}
dan
π
B
{\displaystyle \pi _{B}}
. Pendapatannya berupa jumlah harga yang ditetapkan (
P
A
{\displaystyle P_{A}}
dan
P
B
{\displaystyle P_{B}}
) dikalikan dengan permintaan produk dari masing masing perusahaan (
D
A
{\displaystyle D_{A}}
dan
D
B
{\displaystyle D_{B}}
). Karena fungsi pendapatan dari perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
berbentuk model ordo kedua (second-order), maka kedua model diasumsikan memiliki bentuk concave. Untuk menemukan titik optimum global, kedua fungsi pendapatan diturunkan. Kondisi ordo pertama dari model pendapatan dapat diperoleh jika fungsi pendapatan diturunkan terhadap masing-masing keputusan harga. Respon terbaik dapat diperoleh jika
d
π
A
(
P
A
,
P
B
)
d
P
A
=
0
{\textstyle {d\pi _{A}(P_{A},P_{B}) \over dP_{A}}=0}
dan
d
π
B
(
P
B
,
P
A
)
d
P
B
=
0
{\textstyle {d\pi _{B}(P_{B},P_{A}) \over dP_{B}}=0}
. Keseimbangan Bertrand Nash akan ditemukan pada kondisi berikut:
D
A
>
D
B
=
0
jika
P
B
≥
P
A
D
B
>
D
A
=
0
jika
P
A
≥
P
B
D
B
=
D
A
jika
P
A
=
P
B
{\displaystyle {\begin{aligned}D_{A}>D_{B}&=0&{\text{jika}}\quad P_{B}\geq P_{A}\\D_{B}>D_{A}&=0&{\text{jika}}\quad P_{A}\geq P_{B}\\D_{B}=D_{A}&&{\text{jika}}\quad P_{A}=P_{B}\end{aligned}}}
Permodelan Bertrand pun juga cukup terbatas dengan beberapa asumsi dan batasan. Model Bertrand mengasumsikan bahwa permintaan sangat dipengaruhi oleh harga. Tentunya, setiap permintaan memiliki pola preferensi yang berbeda (tidak hanya harga). Apabila diterapkan model keuntungan (profit) dengan nilai biaya (cost) yang berbeda pada setiap perusahaan, akan menghasilkan perspektif keseimbangan yang berbeda juga.
= Model kepemimpinan Stackelberg
=
Pada 1934, matematikawan dan ekonom jerman yang bernama Heinrich Freiherr von Stackelberg, mengembangkan model pasar kepemimpinan pada bukunya yang berjudul Market Structure and Equilibrium (Marktform und Gleichgewicht). Stackelberg menuturkan bahwa terdapat persaingan antar perusahaan dimana beberapa perusahaan pasti akan memiliki kekuatan pasar yang lebih kuat. Model Stackelberg memiliki dua jenis agen dalam permainannya, pemimpin (leader) dan pengikut (follower). Pemimpin merupakan tipe pemain dengan kekuatan pasar yang lebih kuat dibanding tipe pemain pengikut. Pemimpin akan menentukan strateginya lebih dahulu (First mover) dibanding pengikut. Alhasil, tipe
permainan dari model Stackelberg adalah
permainan sekuensial (Sequential Games). Penyelesaian tipe
permainan ini menggunakan backward induction. Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelan Stackelberg :
Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagi informasi (Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang tidak seimbang. Beberapa perusahaan merupakan perusahaan berkekuatan pasar yang besar (pemimpin) dan berkekuatan pasar yang kecil (pengikut)
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, atau payoff mereka.
Poin 1, 2, 3 dan 5 cukup sama dengan pemodelan Cournot dan Bertrand. Kunci dari model ini adalah pada poin 4. Kondisi keseimbangan dari
permainan sekuensial disebut Subperfect Nash Equilibrium. Hal ini cukup berseberangan dengan konsep keseimbangan Nash dimana semua agen yang berkompetisi menetapkan strateginya secara simultan. Sebagai contoh pada pemodelan Cournot, perusahaan
A
{\displaystyle A}
adalah pemimpin dan perusahaan
B
{\displaystyle B}
adalah pengikut. Artinya, perusahaan
A
{\displaystyle A}
memilliki kekuatan pasar yang lebih besar dibanding perusahaan
B
{\displaystyle B}
. Dalam Cournot, perusahaan
A
{\displaystyle A}
menghasilkan produk sebesar
q
A
{\displaystyle q_{A}}
unit dan perusahaan
B
{\displaystyle B}
menghasilkan produk sebesar
q
B
{\displaystyle q_{B}}
unit. Pemodelan Stackelberg yang diformulasikan dengan pendekatan pemrograman matematika (Mathematical Programming) disebut pemrograman Bilevel atau Nested Optimization. Bentuk model pendapatan dari perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
adalah sebagai berikut.
max
(
q
A
)
π
A
(
q
A
,
q
B
)
=
[
a
−
b
×
(
q
A
+
q
B
)
]
×
q
A
S
.
T
q
B
∈
arg
max
(
q
B
)
π
B
(
q
B
,
q
A
)
=
[
a
−
b
×
(
q
A
+
q
B
)
]
×
q
B
{\displaystyle {\begin{aligned}&\max(q_{A})\quad \pi _{A}(q_{A},q_{B})=[a-b\times (q_{A}+q_{B})]\times q_{A}\\&S.T\\&q_{B}\in \arg \max(q_{B})\quad \pi _{B}(q_{B},q_{A})=[a-b\times (q_{A}+q_{B})]\times q_{B}\end{aligned}}}
Pendekatan yang digunakan untuk menyelesaikan model berikut adalah Backward Induction. Perusahaan
A
{\displaystyle A}
, sebagai pemimpin, dapat mengantisipasi gerakan dari perusahaan
B
{\displaystyle B}
sebagai pengikut. Jadi dalam fungsi pendapatan perusahaan
A
{\displaystyle A}
, respon terbaik dari perusahaan
B
{\displaystyle B}
digunakan untuk mensubsitusi
q
B
{\displaystyle q_{B}}
. Alhasil, perusahaan
A
{\displaystyle A}
dapat dikatakan bergerak lebih dahulu (first mover).
q
B
=
a
−
b
×
q
A
2
b
π
A
(
q
A
)
=
[
a
−
b
×
(
q
A
+
a
−
b
×
q
A
2
b
)
]
×
q
A
{\displaystyle {\begin{aligned}q_{B}&={\frac {a-b\times q_{A}}{2b}}\\\pi _{A}(q_{A})&=[a-b\times (q_{A}+{\frac {a-b\times q_{A}}{2b}})]\times q_{A}\\\end{aligned}}}
Karena fungsi pendapatan perusahaan
A
{\displaystyle A}
masih termasuk ke model ordo kedua (second-order), maka fungsi pendapatan diturunkan terhadap
q
A
{\displaystyle q_{A}}
untuk melihat kondisi ordo pertamanya (first-order).
d
π
A
(
q
A
)
d
q
A
=
b
2
−
2
2
×
(
a
−
2
b
×
q
A
)
=
0
{\displaystyle {d\pi _{A}(q_{A}) \over dq_{A}}={\frac {b^{2}-2}{2}}\times (a-2b\times q_{A})=0}
Kondisi optimal dari perusahaan
A
{\displaystyle A}
adalah:
q
A
=
a
2
b
{\displaystyle q_{A}={\frac {a}{2b}}}
Berdasar strategi dari
q
A
{\displaystyle q_{A}}
dari perusahaan
A
{\displaystyle A}
,maka perusahaan
B
{\displaystyle B}
akan menentukan strateginya berdasar respon terbaiknya. Dengan mensubsitusi fungsi
q
A
{\displaystyle q_{A}}
pada respon terbaik
q
B
{\displaystyle q_{B}}
, strategi perusahaan
B
{\displaystyle B}
adalah sebagai berikut:
q
B
=
a
−
b
×
a
2
b
2
b
=
a
4
b
{\displaystyle {\begin{aligned}q_{B}&={\frac {a-b\times {\frac {a}{2b}}}{2b}}\\&={\frac {a}{4b}}\\\end{aligned}}}
Dengan keputusan strategi yang sudah ditetapkan perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
, strategi mencapai Subperfect Nash Equilibrium. Jadi perusahaan
A
{\displaystyle A}
dan
B
{\displaystyle B}
akan mencoba untuk memproduksi
q
A
{\displaystyle q_{A}}
dan
q
B
{\displaystyle q_{B}}
produk sebesar
a
2
b
{\displaystyle {\frac {a}{2b}}}
dan
a
4
b
{\displaystyle {\frac {a}{4b}}}
unit. Berdasar keputusan yang sudah seimbang, keluarannya adalah sebagai berikut:
Q
=
q
A
+
q
B
=
a
2
b
+
a
4
b
=
3
a
4
b
p
(
q
A
,
q
B
)
=
a
−
b
×
(
q
A
+
q
B
)
=
a
−
b
(
3
a
4
b
)
=
a
4
π
A
=
p
(
q
A
,
q
B
)
×
q
A
a
4
×
a
2
b
=
a
2
8
b
π
b
=
p
(
q
A
,
q
B
)
×
q
B
a
4
×
a
4
b
=
a
2
16
b
{\displaystyle {\begin{aligned}Q&=q_{A}+q_{B}&\\&={\frac {a}{2b}}+{\frac {a}{4b}}\\&={\frac {3a}{4b}}\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\\&=a-b({\frac {3a}{4b}})\\&={\frac {a}{4}}\\\pi _{A}&=p(q_{A},q_{B})\times q_{A}\\&{\frac {a}{4}}\times {\frac {a}{2b}}\\&={\frac {a^{2}}{8b}}\\\pi _{b}&=p(q_{A},q_{B})\times q_{B}\\&{\frac {a}{4}}\times {\frac {a}{4b}}\\&={\frac {a^{2}}{16b}}\end{aligned}}}
Dari strategi, harga, dan payoff dari setiap perusahaan, perusahaan
A
{\displaystyle A}
akan menghasilkan kuantitas produksi 2 kali lipat dibanding perusahaan
B
{\displaystyle B}
(
q
A
q
B
=
a
2
b
a
4
b
=
2
{\displaystyle {\frac {q_{A}}{q_{B}}}={\frac {\frac {a}{2b}}{\frac {a}{4b}}}=2}
) dan perusahaan
A
{\displaystyle A}
akan mendapatkan pendapatan 2 kali lipat dari perusahaan
B
{\displaystyle B}
(
π
A
π
B
=
a
2
8
b
a
2
16
b
=
2
{\displaystyle {\frac {\pi _{A}}{\pi _{B}}}={\frac {\frac {a^{2}}{8b}}{\frac {a^{2}}{16b}}}=2}
). Hal ini menunjukan sebuah keuntungan menjadi pemimpin atau agen dengan cakupan pasar yang lebih besar dibanding dengan pengikut.
Skema Cournot vs. Stackelberg
Dengan melakukan perbandingan antara keseimbangan Nash dari Cournot dan Subperfect Nash Equilibrium dari Stackelberg, beberapa poin dihasilkan:
Keputusan dari pemimpin pasar (leader) Stackelberg akan produksi lebih besar 1,5 kali lipat dibanding perusahaan dengan skema
permainan simultan (
q
A
(
S
t
a
c
k
e
l
b
e
r
g
)
q
A
(
C
o
u
r
n
o
t
)
=
a
2
b
a
3
b
=
1
1
2
{\displaystyle {\frac {q_{A}(Stackelberg)}{q_{A}(Cournot)}}={\frac {\frac {a}{2b}}{\frac {a}{3b}}}=1{\frac {1}{2}}}
).
Keputusan dari pengikut pasar (follower) Stackelberg akan produksi lebih kecil 0,75 kali lipat dibanding perusahaan dengan skema
permainan simultan (
q
B
(
S
t
a
c
k
e
l
b
e
r
g
)
q
B
(
C
o
u
r
n
o
t
)
=
a
4
b
a
3
b
=
3
4
{\displaystyle {\frac {q_{B}(Stackelberg)}{q_{B}(Cournot)}}={\frac {\frac {a}{4b}}{\frac {a}{3b}}}={\frac {3}{4}}}
).
Harga hasil produksi pada
permainan Stackelberg lebih kecil 0.75 kali lipat dibanding
permainan Cournot (
p
(
S
t
a
c
k
e
l
b
e
r
g
)
p
(
C
o
u
r
n
o
t
)
=
a
4
a
3
=
3
4
{\displaystyle {\frac {p(Stackelberg)}{p(Cournot)}}={\frac {\frac {a}{4}}{\frac {a}{3}}}={\frac {3}{4}}}
)
Pendapatan dari pemimpin pasar (leader) Stackelberg akan lebih besar
1
1
8
{\displaystyle 1{\frac {1}{8}}}
kali lipat dibanding perusahaan dengan skema
permainan simultan (
π
A
(
S
t
a
c
k
e
l
b
e
r
g
)
π
A
(
C
o
u
r
n
o
t
)
=
a
2
8
b
a
2
9
b
=
1
1
8
{\displaystyle {\frac {\pi _{A}(Stackelberg)}{\pi _{A}(Cournot)}}={\frac {\frac {a^{2}}{8b}}{\frac {a^{2}}{9b}}}=1{\frac {1}{8}}}
)
Pendapatan dari pengikut pasar (follower) Stackelberg akan lebih kecil
9
16
{\displaystyle {\frac {9}{16}}}
kali lipat dibanding perusahaan dengan skema
permainan simultan (
π
B
(
S
t
a
c
k
e
l
b
e
r
g
)
π
B
(
C
o
u
r
n
o
t
)
=
a
2
16
b
a
9
b
=
9
16
{\displaystyle {\frac {\pi _{B}(Stackelberg)}{\pi _{B}(Cournot)}}={\frac {\frac {a^{2}}{16b}}{\frac {a}{9b}}}={\frac {9}{16}}}
).