<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1> Show
Mơ hình với biến phụ thuộc bị giới hạn(Models with Limited Dependent Variables)Lê Việt Phú Trường Chính sách Cơng và Quản lý Fulbright </div> Các loại hình biến phụ thuộc bị giới hạnI Đơn giản nhất là biến phụ
thuộc là biến xác suất xảy ra một o Doanh nghiệp có bị phá sản hay khơng; có vay tiền ngân hàng I Biến phụ thuộc thể hiện hành vi lựa chọn trong mô hình đa o Lựa chọn smartphone thương hiệu gì trong số các mặt hàng o Xếp hạng một bộ phim từ: rất kém, kém, trung bình, hay, rất I
Biến phụ thuộc là số lần xảy ra một sự kiện: o Số lần một người vi phạm hành vi bạo lựa gia đình, số lần đi I Biến phụ thuộc có giá trị bị chặn dưới hoặc chặn trên: </div> Tại sao kiểm soát vấn đề biến phụ thuộc bị giới hạn rấtquan trọng?I Khơng thỏa các giả định của mơ hình hồi quy tuyến tính
cổ o Phương sai của sai số thay đổi o Ước lượng bị chệch o Ước lượng không nhất quán o Ước lượng không hiệu quả I Để hiểu xảy ra vấn đề gì thì phải dựa vào hiểu biết của dữ liệu I Lựa chọn khi phải đối phó với biến phụ thuộc bị giới hạn: o Tiếp tục sử dụng OLS và chấp nhận các vấn đề có thể gặp </div> Các mơ hình tương ứng với các loại biến phụ thuộc bị giớihạnI Mơ hình xác suất: LPM, Logit, Probit I Mơ hình đa lựa chọn: Multinomial logit/probit, conditional logit I Mơ hình biến xếp hạng: Ordered logit/probit I Mơ hình số lần xảy ra một sự kiện: Poisson count model I Mơ hình biến phụ thuộc bị chặn:Tobit model for
censored </div> Khái niệm biến phụ thuộc bị chặn (censored data)I Biến tiền lương bị chặn dưới bởi giá trị 0 đối với những người I Rất nhiều biến số kinh tế bị chặn dưới bởi giá trị 0, ví dụ: o Số giờ lao động của phụ nữ đã có gia đình. o
Số tiền làm từ thiện của một người trong một năm. o Số lít rượu bia một người uống trong một năm. o Chi tiêu cho hàng hoá xa xỉ của hộ gia đình trong dịp lễ tết. o Thời gian thất nghiệp của một người lao động. I Dữ liệu có thể bị chặn trên hoặc chặn dưới do cách thức điều </div> Hồi quy OLS của số giờ đi làm trong nămI Biến phụ thuộc bị chặn dưới tại 0. I Ước lượng bằng OLS với nhóm làm việc có thể bị thiên lệch </div> Các cách xử lý biến phụ thuộc bị chặnI Cách 1: ước lượng mơ hình Logit/Probit với biến phụ thuộc là </div> Mơ hình Tobit với biến phụ thuộc bị chặnBản chất của mô hình Tobit là hồi quy hai bước theo tuần tự: I Bước 1: Ước lượng xác suất quan sát
được một người có </div> Xây dựng mơ hình TobitThơng thường hành vi làm việc của một người được diễn giải bởi y∗= X ∗ β + u, u ∼ N(0, σ2) trong đó y∗ là biến phụ thuộc ẩn (latent variable), không quan sát y = max (0, y∗) o Chúng ta quan sát được y > 0 đối với những người đi làm. </div> Xây dựng mơ hình TobitChúng ta có thể tìm được phương trình ước lượng của biến phụ E [y |x ] = P(y = 0|x ) ∗ E [y = 0|x ] | {z } =0 +
P(y > 0|x ) ∗ E [y |y > 0, x ] | {z } >0 trong đó: P(y > 0|x ) = P(X ∗ β + u > 0) = P(u X ∗ β X ∗ β </div> Xây dựng mơ hình TobitNgồi ra, chúng ta có biểu thức sau (học viên tự chứng minh): E [y |y > 0, x ] = X ∗ β + σλ(X ∗ β </div> Xây dựng mơ hình TobitTừ các cơng thức trên, chúng ta có phương trình hàm hồi quy E [y |x ] = Φ(X ∗ β σ ) ∗ X ∗ β + σφ( σ ) E [y |x ] = X ∗ β o Hồi quy Tobit là hàm phi tuyến của các tham số và biến giải </div> Ước lượng mơ hình Tobit và diễn giải ý nghĩaI Mơ hình Tobit được ước lượng bằng phương pháp MLE thay I Diễn giải sự khác biệt của các hệ số ước lượng: o Với OLS thì β là tác động biên của các biến giải thích lên biến ∂E [y |x ] = βj o Với
Tobit thì chúng ta phải tính tác động biên từ phương trình ∂E [y |x ] = Φ(X ∗β<sub>σ</sub> ) ∗ X ∗ β + σφ(X ∗β<sub>σ</sub> ) ∂xj </div> Tác động biên trong mơ hình TobitI Nếu biến
giải thích là biến liên tục, chứng minh cơng thức sau ∂E [y |x ] = Φ(X ∗ β I Nếu biến giải thích là biến rời rạc x0, x1: ∆y = E [y |x1] − E [y |x0] I Tác động biên của mơ hình Tobit sẽ phụ thuộc vào giá trị I Tương tự như hồi quy Logit/Probit, Φ(X ∗β<sub>σ</sub>
) được tính tại các </div> Ví dụ 1: Sử dụng bộ dữ liệu Labor.dta và ước lượng hàmcung lao động của phụ nữ đã có gia đìnhGiả sử chúng ta muốn ước lượng mơ hình hàm cung số giờ lao động như sau: hours =β0+ β1netincome + β2educ + β3exper + β4exper2+
β5age + β6KIDS 6 + β7KIDS 7 + u </div> Ước tính tác động biênI Tác động biên của việc học thêm một năm lên số giờ lao động I Tác động biên lên số giờ lao động của phụ nữ chưa có con </div> Tổng kết mơ hình TobitI Khi dữ liệu quan sát được bị chặn tại một ngưỡng giá trị nào I Sử dụng mơ hình Tobit và phương pháp MLE có thể sửa được </div> Học viên cần phân biệt hai tình huống và hai cách thức xử lý khác o Chỉ áp dụng hồi quy Tobit với dữ liệu bị chặn (có nghĩa là dữ khiến dữ
liệu thu thập được bị chặn tại một ngưỡng quan sát o Khi dữ liệu gặp phải vấn đề tự lựa chọn mẫu (ví dụ khơng </div> Mơ hình với dữ liệu khơng ngẫu nhiên(Models with non-random sample/</div> Khái niệm dữ liệu không ngẫu nhiên/Vấn đề tự lựa chọnmẫuI Do cách thiết kế mẫu khiến dữ liệu bị mất hoặc thiếu một I Do dữ liệu bị thiếu một số thông tin nhất định. </div> Hiệu lực nội tại khi xảy ra vấn đề lựa chọn mẫuGiả sử chúng ta có mơ hình hồi quy của thu nhập y theo các biến y = β0+ β1x1+ ... + βkxk + u thỏa các điều kiện của mơ hình CLRM và E [u|x1, ..., xk] = 0 lượng OLS không chệch và nhất quán. I Khi dữ liệu bị thiếu: o Dữ liệu bị thiếu ngẫu nhiên? </div> I Thiếu ngẫu nhiên: Ước lượng OLS đảm bảo hiệu lực nội tại, </div> Dữ liệu không ngẫu nhiên do q trình chọn mẫu dựa trênbiến giải thíchXảy ra trong q trình thiết kế hay điều tra mẫu, ví dụ chỉ điều tra I Không ảnh hưởng đến hiệu lực nội tại, nhưng có thể ảnh </div> Dữ liệu khơng ngẫu nhiên do q trình chọn mẫu xảy ratrên biến phụ thuộcXảy ra do không thể quan sát được hay quan sát không đủ dữ liệu. I Ảnh hưởng đến hiệu lực nội tại. </div> Xử lý khi dữ liệu không ngẫu nhiênCần hiểu rõ bản chất của dữ liệu và nguồn gơc của vấn đề lựa I Nếu giả định những người không đi làm nhận mức lương bằng </div> Ví dụ vấn đề chọn mẫu khi ước lượng hàm tỷ suất thunhập của việc đi họcChúng ta có thơng tin của những người đi làm cơng ăn lương và I Nếu chỉ giới hạn ở mẫu dữ liệu những người đang đi làm và I Nếu chúng ta đưa tồn bộ dữ liệu (gồm cả những người </div> Xây dựng mơ hình điều chỉnh vấn đề lựa chọn mẫuMơ hình lựa chọn mẫu được viết dưới dạng hệ phương trình
cấu ( y = X β + u </div> Ý nghĩa của phương trình lựa chọn mẫu sPhương trình lựa chọn được biểu diễn dưới dạng hàm chỉ số s = 1 if Z γ + v ≥ 0 0 otherwise I Nếu Z<sub>i</sub>γ + v ≥ 0 ⇒ si = 1, có nghĩa là chúng ta quan sát được cá nhân i trong phương trình hành vi (cá nhân i có thu I Nếu si = 0 có nghĩa là chúng ta khơng có cá nhân i trong </div> Ý nghĩa của phương trình hành vi yVới điều kiện quan sát được cá nhân có thu nhập thì phương như thế nào đến thu nhập y . y = X β + u </div> Các bước xây dựng và ước lượng mơ hình hồi quy điềuchỉnh vấn đề lựa chọn mẫuBắt đầu bằng hệ phương trình cấu trúc: ( y = X β + u Bỏ qua các bước biến đổi trung gian (học viên tự chứng minh), </div> trong đó: o λ(.) là tỷ số Mills nghịch đảo (Mills Inverse Ratio-IMR), được λ(Z γ) = φ(Z γ) φ(.) và Φ(.) là hàm mật độ và hàm tích lũy phân phối chuẩn. o λ(Z γ) được coi như một biến giải thích phụ đưa vào để điều o X là các biến giải thích trong mơ hình cấu trúc. o β và ρ là tham số cần ước lượng của phương trình hành vi có </div> Tóm lại, chúng ta cần ước lượng phương trình hành vi có điều kiện E [y |Z , s = 1] = X β + ρλ(Z γ) o Các tham số của mơ hình hành vi có điều kiện là β và ρ. o Các biến giải thích là X và tỷ số λ(Z γ). </div> Heckman sample selection modelBản chất của phương pháp điều chỉnh mẫu (các tên khác: hồi quy 1. Ước lượng phương trình tự lựa chọn mẫu s để tính λ(Z γ). </div> Ước lượng hồi quy điều chỉnh mẫu bằng hồi quy hai giaiđoạn1. Ước lượng mơ hình lựa chọn mẫu (cá nhân có thu nhập hay sử dụng toàn bộ bộ dữ liệu của những người trong độ tuổi lao P(s = 1|Z ) = Φ(Z γ + v ) Tính giá trị \λ(Z γ) bằng cơng thức: \ λ(Z γ) = φ(Z ˆγ) </div> Ước lượng hồi quy điều chỉnh mẫu bằng hồi quy hai giaiđoạn2. Ước lượng mơ hình hành vi có điều kiện bằng OLS, với dữ liệu </div> Ước lượng hồi quy điều chỉnh mẫu bằng hồi quy hai giaiđoạno Bản chất của phương pháp Heckit là chúng ta đưa thêm một o X tác động lên biến phụ thuộc thu nhập trong phương trình </div> Ví dụ 2: ước lượng tác động của thủy lợi đến năng suất lúavà ngô bằng phương pháp hàm sản xuấtSử dụng bộ dữ liệu irrigation.dta. I Chúng ta quan sát được sản lượng lúa và ngơ trên từng mảnh I Mảnh đất được tưới tiêu được kỳ vọng có sản lượng cao hơn. </div> Giả sử hàm sản xuất dạng logarithm như sau: log (Qi) = α0+ α1× DIRRIi + X j INPUTji × αj + X k LANDki
× αk +X n DEMOni × αn+ ui trong đó: I Q là tổng sản lượng trên một công đất (kg/1000m2) một I DIRRI là biến mảnh ruộng có được tưới tiêu hay không. </div> Nhận diện vấn đề lựa chọn mẫu trong bài tốn thủy lợiI Chính sách nông
nghiệp ở Việt Nam yêu cầu một số loại đất </div> Mơ hình 1: Ước lượng hàm
sản xuất bằng OLS log (Qi) = α0+ α1× DIRRIi + X j INPUTji × αj + X k LANDki × αk +X n DEMOni × αn+ ui Mơ hình 2: Hàm hồi quy có điều chỉnh vấn đề chọn mẫu log (Q<sub>i</sub>rice) = α0+ α1× DIRRIi + ... + ρλ(Ziγ) + ui P(si = 1|Zi) = Φ(Ziγ + vi) </div> So sánh và kiểm định mơ hình lựa chọn mẫuI So sánh kết quả giữa mơ hình OLS và Heckit: Đúng là có hiện I Kiểm định có vấn đề tự lựa chọn mẫu: Ho : ρ = 0. Nếu bác </div> <!--links--> |