Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Gần đây tôi có nghe GS James Stock trình bày về lịch sử hồi quy IV và có được một số tài liệu từ thầy. Thấy cũng thú vị nên viết đây chia sẻ với mọi người.

Để bắt đầu: hồi quy biến công cụ IV là gì?

Hồi quy với biến công cụ được sử dụng khi ước lượng các mô hình liên quan đến vấn đề biến nội sinh (endogeneity). Một số ví dụ như sau:

Ở mô hình trên xem xét ảnh hưởng của biến X đến biến Y. Mô hình này có thể được ước lượng bởi OLS chỉ khi các điều kiện của Định lý Gauss-Markov được thỏa mãn. Một trong những điều kiện là không có sự tương quan giữa X và nhiễu e, nói cách khác X là biến ngoại sinh. Tuy nhiên, nếu điều này không được thỏa mãn, ước lượng sẽ bị thiên lệch (biased) khi sử dụng OLS. Nếu tương quan giữa X và e là dương: , khi X tăng e sẽ tăng nên Y sẽ tăng nhiều hơn, do vậy khi ước lượng, kết quả thu được là nhiều khả năng bị thiên lệnh lên (upward biased). Ngược lại nếu tương quan giữa X và e là âm thì nhiều khả năng bị thiên lệnh xuống (downward biased). Để có thể ước lượng mô hình này, ta cần tìm công cụ Z mà tương quan với X, nhưng không tương quan với e. Ví dụ như nghiên cứu của Angrist và Krueger (1991) ước lượng ảnh hưởng của số năm đi học và thu nhập:

Thu nhập và số năm đi học đều có liên quan đến năng lực cá nhân (ability). Tuy nhiên, năng lực cá nhân không đưa vào mô hình (lý do chính là không có dữ liệu đánh giá chính xác), nên sẽ có sự tương quan giữa biến school và nhiễu, do vậy cần tìm biến công cụ cho school để có được ước lượng không thiên lệch.

Bên cạnh phương trình đơn, hồi quy IV còn được sử dụng để ước lượng hệ thống các phương trình đồng thời (Simultaneous equation models). Ví dụ như phương trình cung và cầu như sau:

: cung, : cầu, : giá. Với số liệu về sản lương Q và P, làm thế nào để ước lượng đường cung và đường cầu.

Để ước lượng đường cầu, ta cần tìm biến công cụ mà làm dịch chuyển đường cung, trong khi không làm dịch chuyển đường cầu (như hình 1). Ngược lại, để ước lượng đường cung, ta cần phải tìm biến công cụ mà làm dịch chuyển đường cầu, trong khi không làm dịch chuyển đường cung.

Hình 1: Xác định đường cầu

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Nếu biến công cụ làm dịch chuyển cả 2 đường như hình 2, thì biến công cụ này không có ích để xác định được đường cung hay cầu (hay theo thuật ngữ là: công cụ yếu- weak instruments).

Hình 2: Cung hay cầu

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Trở lại câu chuyện chính: ai phát minh ra hồi quy biến công cụ IV.

Nghiên cứu đầu tiên mà sử dụng IV để ước lượng mô hình có vấn đề nội sinh là của Philip G. Wright, The Tariff on Animal and Vegetable Oils, xuất bản vào năm 1928 (Phụ lục B, như Hình 3) (Download bài nghiên cứu). Như trong hình 3, để ước lượng đường cung, tìm công cụ A (giá của sản phẩm thay thế sẽ làm dịch chuyển đường cầu) , và để ước lượng đường cầu, dựa vào công cụ B (năng suất mỗi acre, do vậy làm dịch chuyển đường cung).

Hình 3: Phụ lục B (Wright, 1928)

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Tuy nhiên, điều thú vị là: không rõ ai là tác giả của Phụ lục B- Philip Wright hay Sewall Wright (con trai cả của Philip, là một nhà di truyền nổi tiếng thế kỷ 20). Sewall qua đời năm 1988, nên không thể hỏi trực tiếp được. Trước nghiên cứu của Philip, trong một nghiên cứu năm 1925, Sewall sử dụng biến công cụ để ước lượng chu kỳ bắp ngô và heo, tuy nhiên trong mô hình của Sewall, các biến giải thích là biến ngoại sinh, nên chỉ cần sử dụng OLS. Không rõ tại sao Sewall sử dụng OLS, nguyên do chính có lẽ để dễ tính toán hơn (https://scholar.harvard.edu/stock/content/history-iv-regression).

Để trả lời câu hỏi này, nghiên cứu của James và Franchesco (2003) (Download bài nghiên cứu) sử dụng phương pháp nghiên cứu dữ liệu xác định phong cách (dựa vào ngữ pháp và cách sử dụng từ) và xác định rằng Philip là tác giả của Phụ lục B. Mặc dù vậy James và Franchesco không thể chắc chắn ai là người nghĩ đến việc sử dụng biến công cụ để giải quyết vấn đề nội sinh: ý tưởng chung, hay là ý tưởng của Sewall và Philip chỉ ghi lại.

Tuy nhiên, từ những lá thư trao đổi giữa Philip và Sewall, có thể kết luận rằng, hồi quy biến công cụ là kết quả của những lần trao đổi giữa hai cha con. Sewall là tác giả của phân tích sơ đồ đường (path analysis) và đã trao đổi với Philip về phân tích này.

Philip viết cho Sewall vào tháng 3 năm 1926 rằng: “I have worked out for your math of estimating supply and demand curves without reference to the theory of path coefficients.”

(Cha đã giải quyết được bài toán của con liên quan đến ước lượng đường cung và cầu mà không cần phải sử dụng đến lý thuyết về hệ số path)

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Và trong cùng bức thư, Philip đã viết (chính là phụ lục B):

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Quả thật là thú vị về cha con Philip và Sewall. Xin cảm ơn hai vị tiền bối và cảm ơn GS James Stock vì những tư liệu này.

Chạy mô hình hồi quy lồng ghép so sánh năm 2024

Nguồn: Hamilton (2016), “Why You Should Never Use the Hodrick-Prescott Filter”

Trong một nghiên cứu gần đây Giáo sư James Hamilton (University of California, San Diego) khuyên Đừng bao giờ sử dụng bộ lọc HP. GS James là tác giả của quyển sách Phân tích chuỗi thời gian (Time Series Analysis), được ví như là Kinh thánh của Kinh tế lượng.

Các lý do mà GS James đưa ra có thể được hiểu như sau (Xem bài viết chi tiết tại đây):

  • (1) Bộ lọc HP là thuần túy thống kê, không dựa trên bất kỳ nền tảng cơ bản (mối quan hệ bản chất) của quy trình tạo ra data, nên mối quan hệ động của các chuỗi số liệu có được từ bộ lọc HP là đáng ngờ.
  • (2) Các giá trị được lọc cuối mẫu ít có tính chính xác cao, do vậy không đáng tin cậy. Ví dụ, dựa vào chuỗi thời gian 1995:Q4-2007:Q4, sản lượng tiềm năng và khoảng cách sản lượng của 2007:Q4 (cuối mẫu) thường được đo lường ít chính xác hơn các biến tương ứng tại các thời điểm trước đấy ví dụ như 2004:Q4.
  • (3) Khi sử dụng bộ lọc HP, chúng ta phải chỉ ra giá trị làm trơn (smoothing parameter). Hodrick and Prescott để xuất giá trị 1600 đối với số liệu theo quý. Tuy nhiên, khi sử dụng quy trình thống kê để ước lượng giá trị làm trơn thì kết quả tối ưu thấp hơn nhiều so với con số 1600 thường được sử dụng.
  • (4) Một phương pháp khác tốt hơn: Hồi quy của một biến X tại thời điểm t+h trên bốn giá trị gần đây nhất của X sẵn có tại thời điểm t. Phương pháp lọc số liệu (detrend- loại trừ tính xu hướng) này đạt được tất cả các mục tiêu như của bộ lọc HP trong khi tránh được những hạn chế của nó.

Từ những lời khuyên này, đặc biệt liên quan đến lý do số 2, sử dụng bộ lọc HP để đánh giá trạng thái nền kinh tế tại thời điểm cuối mẫu (thời điểm mà số liệu có gần nhất) sẽ dẫn đến những kết quả không đáng tin cậy. Ví dụ cụ thể, tại thời điểm 2017Q2, NHTW cần ra quyết định chính sách tiền tệ. Để thực hiện chính sách đòi hỏi phải có được những nhận định về trạng thái hiện tại của nền kinh tế. Cách tiếp cận hay được sử dụng là sử dụng bộ lọc HP với số liệu sản lượng từ 2000:Q1-2017Q1 và có được giá trị của khoảng cách sản lượng tại thời điểm 2017Q1 (Vì số liệu sản lượng thường có đỗ trễ là 1 quý và tính ỳ của khoảng cách sản lượng nên ước lượng khoảng cách sản lượng tại 2017Q1 có thể giúp đưa ra những đánh giá tin cậy hơn về mức khoảng cách sản lượng tại thời điểm hiện tại 2017Q2) . Tuy nhiên cần lưu ý rằng, những kết quả lọc HP về cuối mẫu ít có tính chính xác cao, do vậy cần phải thận trọng trong việc tham khảo các giá trị cuối mẫu làm nền tảng để đưa ra các quyết định chính sách. Ví dụ nền kinh tế đang ở mức cao hơn sản lượng tiềm năng, nhưng kết quả lọc HP lại là thấp hơn nên dẫn đến chính sách tiền tệ nới lỏng. Sai lầm chính sách này như bơm dầu vào lửa và có thể đẩy lạm phát tăng nhanh chóng.

Bạn đọc Yi có hỏi rằng: “”Hiện trong function “szbvar” và “msbvar” của R package này em thấy tác giả đã mặc định thông số lambda để fit model, rồi từ đó chạy ra dự báo. Em có thắc mắc nhỏ là có function nào chọn ra được các thông số này để tối thiểu hóa được sai số dự báo không ạ”

Đây là một câu hỏi hay và quan trọng ở khía cạnh ứng dụng. Mục đích của lambda chính là kiểm soát vai trò của thông tin tiền định.

+ Nếu thông tin tiền định quá chặt (tight prior) – nghĩa là phụ thuộc nhiều vào thông tin tiền định, thì kết quả hậu nghiệm sẽ không khác mấy so với thông tin tiền định. Đây chính là điểm thường bị chỉ trích của tiếp cận Bayesian, vì người nghiên cứu có thể sử dụng thông tin tiền định để “lái” kết quả. Do vậy, trong trường hợp này, thông tin từ data không có nhiều ảnh hưởng đến kết quả. + Ngược lại, nếu thông tin tiền định quá lỏng, thì nó sẽ không có ích và kết quả sẽ chủ yếu phụ thuộc vào data.

Do vậy, giá trị của lambda nên nằm giữa hai thái cực này. Việc xác định những giá trị này là một câu hỏi không phải dễ trả lời. Một vài nghiên cứu hướng dẫn về việc xây dựng thông tin tiền nghiệm trong một số trường hợp. Ví dụ như , nghiên cứu của De Mol và công sự (2008, JoE) “Forecasting using a large number of predictors: Is Bayesian shrinkage a valid alternative to principal components?“ (Link WP: https://www.ecb.europa.eu/pub/pdf/scpwps/ecbwp700.pdf?ffd9f4561990919f315127a2eee70375).

Tuy nhiên, phần lớn các nghiên cứu dựa trên đề xuất của Canova (Chương 10, 2007) “Methods for Applied Macroeconomic Research“ với Minnesota prior. Giáo sư Fabio chia sẻ chương này ở trên website cá nhân: http://apps.eui.eu/Personal/Canova/Articles/ch10.pdf (Đoạn cuối Trang 358) (Chú ý là ký hiệu GS Fabio dùng là phi). Các giá trị này có thể sử dụng như benchmark hoặc là điểm bắt đầu cho những nghiên cứu sâu hơn.

Như đã đề cập trong về việc sử dụng BVAR, nếu bạn nào đã quen dùng R, thì có thể sử dụng MSBVAR package (Liên quan đến câu hỏi trên: Giá trị của thông số lambda trong MSBVAR được quyết định bởi người sử dụng). Tuy nhiên, với các bạn mới bắt đầu, thì có lẽ sử dụng toolbox BEAR (MATLAB) sẽ dễ dàng hơn (xem hướng dẫn sử dụng ở đây).

Đây là một bài giới thiệu rất rất rất ngắn về mô hình BVAR, xem như là khai vị và “kích não” cho bạn nào thích tò mò. Đây là con đường “lắm gai” đấy, nhưng có thể sẽ là “heroin” gây nghiện với một số đồng chí 🙂

Mô hình VAR là một mô hình phổ biến trong phân tích chuỗi thời gian. Các chủ đề liên quan đến đến mô hình VAR gồm có: mô hình giản lược (reduced form VAR), xác định mô hình cấu trúc (structural VAR) từ mô hình giản lược, hàm phản ứng, phân tích phương sai… Ví dụ một mô hình VAR với p=4 độ trễ VAR(4) với 3 biến nội sinh có dạng như sau:

trong đó

Thông thường, việc ước lượng mô hình VAR đòi hỏi phải ước lượng khá nhiều tham số. Ví dụ như một mô hình VAR 3 biến – lạm phát, sản lượng, và lãi suất – và bốn mức trễ (lag=4) như thường được sử dụng với số liệu theo quý. Mô hình này gồm có 42 tham số cần phải ước lượng: 1*3 hằng số (intercepts), 12*3 tham số của biến trễ, và 3 tham số của phương sai. Nếu có 80 số liệu theo quý (20 năm), thì việc ước lượng mô hình VAR như vậy thường có tính chính xác không cao (vì mức độ tự do- degrees of freedom- bị hạn chế), và hệ quả là các các dự báo thường đó độ lệch chuẩn lớn (biên dự báo rộng).

Do vậy, các nhà kinh tế lượng Bayesian đã đề xuất việc kết hợp thông tin tiền định –prior information (dựa vào các lý thuyết kinh tế hay các kết quả nghiên cứu từ các quốc gia khác) vào việc ước lượng các mô hình VAR. Cách tiếp cận lồng ghép này còn được gọi là BVAR. Nếu hiểu nôm na là thế này: cái “anh” dữ liệu không đủ thông tin để đạt được các ước lượng ý nghĩa thì mình kết hợp thêm cái thông tin có được từ “chị” lý thuyết (hay là chị thực nghiệm, chị kinh nghiệm, gì gì đấy) vào, để có thể có được những ước lượng ý nghĩa, và qua đó nâng cao khả năng dự báo các biến vĩ mô.

Để sử dụng BVAR, nhà nghiên cứu đưa các thông tin tiền định liên quan đến các tham số của mô hình (hằng số, tham số của biến trễ, hay phương sai của biến nhiễu). Một vài dạng thông tin tiền định phổ biến như:

1)Thông tin tiền định Minnesota (vì nguồn gốc của thông tin này là từ Fed Minnesota): dựa trên giả thuyết rằng các biến nội sinh trong mô hình VAR có dạng bước tự do (random walk process) hoặc theo dạng AR (1).

2)Thông tin tiền định Normal Inverse Wishart prior: có 2 dạng

* Thông tin tiền đinh ghép đôi tự nhiên (natural conjugate prior) -các thông số của mô hình VAR có phân phối tiền nghiệm là phân phối chuẩn, và ma trận hiện phương sai (variance-covariance matrix) có phân phối Inverse Wishart.

* Thông tin tiền định independent Normal inverse Wishart prior: Ví dụ như khi muốn xem xét tham số trễ của một biến nội sinh khác với tham số trễ của các biến khác (ví dụ như giới hạn liên quan đến giả định tính trung tính của tiền: money neutrality)

3)Thông tin tiền định trạng thái cân bằng (Steady State priors) và một số thông tin tiền định khác

Trên đây chỉ là một vài giới thiệu để “khêu gợi”” trí tò mò của các bạn. Để học BVAR các bạn có thể tham khảo các tài liệu sau:

1)Tài liệu khóa học (slides và MATLAB codes) về kinh tế lượng của GS. Gary Koop. Link: https://sites.google.com/site/garykoop/teaching/sgpe-bayesian-econometrics

2)BEAR Toolbox 3.0 (sử dụng với MATLAB): được phát triển bởi Alistair Dieppe, Romain Legrand, và Björn van Roye – nhóm nghiên cứu Ngân hàng Trung Ương châu Âu

3)MSBVAR(Sử dụng với R): của hai nhà nghiên cứu Patrick Brandt và W. Ryan Davis

Chúc các bạn vui học Kinh tế lượng!

Viết một tý về kiểm định giả thiết nhân dịp có bạn đọc hỏi rằng:

“Anh cho e hỏi là có khi nào kiểm định giả thuyết dùng t và p-value thì có mâu thuẫn ko ạ? Giả sử như: t< critical value (fail to reject Ho) và p value<5% (reject Ho)? Cho e hỏi 1 chút là dùng kiểm t thì có dùng giá trị tuyệt đối ko ạ? Ví dụ t=-3.5 , thì mình có thể kết luận t<1.96 (xem xét tại mức 5%) ko ạ?” (Cảm ơn bạn vì câu hỏi).

Xem xét phương trình ước lượng cơ bản sau: Kết quả ước lượng mô hình này với OLS (giả sử rằng các giả định cơ bản của OLS (Định lý Gauss-Markov) được thỏa mãn): Ví dụ như ta muốn kiểm định giả thuyết (kiểm định t) cho thông số

Bước 1: Giả thiết kiểm định: có hai dạng khác nhau – kiểm định một phía hay kiểm định hai phía (Chú ý rằng: giả thiết nên được hình thành trước khi chạy mô hình)

•Kiểm định một phía

Nếu bạn kỳ vọng giá trị thực của thông số là số dương (), giả thiết kiểm định sẽ như sau: (Giả thiết H0 trình bày giá trị không được kỳ vọng) (Giả thiết khác H1 hay HA trình bày giá trị được kỳ vọng) (Chú ý rằng: nguyên tắc kiểm định : trình bày giá trị được kỳ vọng ở giả thuyết khác H1 còn giá trị không được kỳ vọng ở giả thuyết null H0)

Hay là nếu bạn kỳ vọng giá trị thực của thông số là số âm (), giả thiết kiểm định sẽ như sau: (Giả thiết H0 trình bày giá trị không được kỳ vọng) . (Giả thiết khác H1 trình bày giá trị được kỳ vọng)

•Kiểm định hai phía:

Bạn kỳ vọng biến có vai trò ý nghĩa trong việc giải thích dao động của Y. Nghĩa là . Do vậy, giả thuyết kiểm định được trình bày như sau: (Giả thiết H0 trình bày giá trị không được kỳ vọng) (Giả thiết khác H1 trình bày giá trị được kỳ vọng)

Ví dụ: Nghiên cứu các yếu tố ảnh hưởng đến số năm yêu nhau Y: thời gian (số giờ) gặp nhau mỗi tuần (), kết quả học tập của bạn nam (), kết quả học tập của bạn nữ :

Nếu chúng ta kỳ vọng rằng số năm yêu nhau tăng lên nếu thời gian gặp nhau mỗi tuần tăng lên, nghĩa là chúng ta kỳ vọng . Giả thiết kiểm định (một phía) sẽ như sau (Đừng hiểu nhầm một phía là tình yêu đơn phương nhé :)):

Nếu chúng ta kỳ vọng rằng “thời gian gặp nhau” có ý nghĩa quan trọng đối với “số năm yêu nhau”, nghĩa là . Do vậy, giả thuyết kiểm định (hai phía) được trình bày như sau:

Bước 2: Tính thống kê t cho thông số Trong đó:

•: thông số được ước lượng của •: Giả thuyết null H0 cho thông số mà chúng ta muốn kiểm định. Thông thường, vì chúng ta muốn nghiên cứu vai trò giải thích của biến đối với dao động của biến phụ thuộc Y. Đây cũng chính là giá trị null được sử dụng bới các phần mềm thống kê, khi in kết quả cuối cùng. Mặc dù vậy, chúng ta hoàn toàn có thể kiểm định giả thiết null với bất kỳ giá trị nào () •: độ lệch chuẩn của

Ở ví dụ trên, Kết quả ước lượng từ mẫu gồm 33 quan sát: N=33 như sau

(0.0727) (0.05) (0.3) (Trong ngoặc là độ lệch chuẩn của các ước lượng tương ứng 0.354 (0.0727), 0.2(0.05) và 0.7(0.3))

Tính giá trị thống kê t cho thông số :

Bước 3: Quy tắc Kiểm định giả thiết

Quy tắc Kiểm định một phía: Phủ định giả thiết nếu VÀ có dấu như giả thuyết . Nếu cả hai điều này không được thỏa mãn, không thể phủ định giả thiết .

Xác định giá trị tới hạn: là giá trị tới hạn tương ứng với mức ý nghĩa được lựa chọn. Ở bảng 1 dưới đây trình bày các giá trị tới hạn của kiểm định t. Giả sử chúng ta kiểm định một phía (one-sided) tại mức ý nghĩa 5%. Đây chính là cột thứ ba trong bảng. Để xác định , chúng ta cần biết độ tự do (Degrees of freedom hay là Dof). Dof được tính như sau Dof= N-K-1 Trong đó: N : số quan sát (N=33 ở ví dụ trên) K: số lượng các thông số góc (slope parameters) (K=3 ở ví dụ trên, Trừ 1 ở công thức trên vì chúng ta mất một Dof để ước lượng Do vậy: Dof = N-K-1 = 33-3-1 = 29 Xem bảng : Cột ba, và hàng Dof = 29, ta có

Chạy mô hình hồi quy lồng ghép so sánh năm 2024
(Nguồn: Studenmund(2014), Using Econometrics; A Pratical Guide, Sixth Edition)

Kiểm định: o o

Sử dụng quy tắc kiểm định một phía: * , do vậy * có dấu dương như giả thiết Do vậy, phủ định giả thiết

Quy tắc kiểm định hai phía: Phủ định giả thiết nếu . Nếu không, không thể phủ định giả thiết .

Xác định giá trị tới hạn: là giá trị tới hạn tương ứng với mức ý nghĩa được lựa chọn. Ở bảng 1 trên trình bày các giá trị tới hạn của kiểm định t. Giả sử chúng ta kiểm định hai phía (two-sided) tại mức ý nghĩa 5%. Đây chính là cột thứ tư trong bảng. Để xác định , chúng ta cần biết độ tự do (Degrees of freedom hay là Dof). Như trên, Dof=29. Xem bảng : Cột thứ tư, và hàng Dof = 29, ta có Kiểm định:

Sử dụng quy tắc kiểm định hai phía: , do vậy Do vậy, phủ định giả thiết

GIÁ TRỊ P Sử dụng giá trị p là cách tiệp cận khác với kiểm định t. Giá trị p cho chúng ta biết giá trị nhỏ nhất của mức ý nghĩa mà chúng ta có thể phủ định giả thiết null : nghĩa là giá trị p càng nhỏ, khả năng phủ định giả thiết càng cao.

Quy tắc kiểm định một phía: Phủ định H0 nếu p-value của thông số nhỏ hơn mức ý nghĩa lựa chọn (ví dụ như 5%) và nếu thông số ước lượng có cùng dấu như H1.

Quy tắc kiểm định hai phía: Phủ định H0 nếu p-value của thông số nhỏ hơn mức ý nghĩa lựa chọn (ví dụ như 5%).

Lợi thế lớn nhất của giá trị p chính là việc dễ sử dụng. Tuy nhiên, hầu hết các giáo trình kinh tế lượng cơ bản sử dụng t-test vì đối với những người bắt đầu học kinh tế lượng, việc sử dụng kiểm định t nhiều khả năng buộc (hay là định hình thói quen) người sử dụng giả thiết hóa (ví dụ như kỳ vọng dấu của các thông số và sử dụng một phía khi có kỳ vọng về dấu) trước khi bắt đầu chạy mô hình. Ngoài ra, một khi đã biết sử dụng kiểm định t, thì việc sử dụng giá trị p tương đối dễ dàng. Nhưng điều ngược lại không phải khi nào cũng đúng.

Đôi chút lưu ý nhỏ liên quan đến kiểm định giả thiết trong kinh tế lượng. Về nội dung dưới đây, có lẽ phần lớn mọi người đã biết, tuy nhiên, nếu bạn nào chưa biết thì hy vọng lưu ý nhỏ này sẽ giúp bạn hoàn thiện hơn bài nghiên cứu.

Xét một giả thiết H0 được đưa ra bởi người nghiên cứu (Ví dụ như: kiểm định xem hệ số a trong phương trình được ước lượng y = c+ ax + e có bằng 0 hay không ; hay trung bình của tập A có bằng trung bình của tập B hay không).

Bước 1: Trước hết, người nghiên cứu sẽ xây dựng giá trị thống kê (statistic value) và so sánh giá trị ấy với giá trị tới hạn (critical value) tương ứng với mức ý nghĩa được lựa chọn (level of significance) – Ví dụ như giá trị tới hạn của t tại 5% mức ý nghĩa và 20 mức tự do là 2.085963

Bước 2: So sánh giá trị thống kê và giá trị tới hạn. Nếu giá trị thống kê lớn hơn giá trị tới hạn, thì kết luận là: “phủ định giả thiết H0”. Tuy nhiên, nếu giá trị thống kê nhỏ hơn giá trị tới hạn thì kết quả là: “không thể phủ định giả thiết H0”. Trong trường hợp này, một số bạn kết luận là “chấp nhận giả thiết H0”. Tuy nhiên, hai kết luận này không hoàn toàn giống nhau và kết luận đầu tiên “không thể phủ định giả thiết H0” hợp lý hơn về bản chất kinh tế lượng. Lý do vì: kết luận được dựa trên giả định rằng mô hình thống kê (chính là mô hình được đề xuất bởi người nghiên cứu) có căn cứ hợp lý. Tuy nhiên, cần lưu ý rằng những giả định làm nền tảng của mô hình không phải hoàn toàn chính xác, mặc dù thường hợp lý (ví dụ cơ bản như: giả định rằng các quan sát độc lập và có phân phối đồng nhất có thể hợp lý nhưng không hoàn toàn chính xác). Một hệ quả quan trọng của điều này chính là kiểm định có thể được sử dụng để chứng minh tính không căn cứ của giả thuyết được đặt ra (phủ định giả thiết), tuy nhiên việc ủng hộ một giả thiết chỉ tiếp tục khi mà chúng ta “không thể phủ định nó”. (Xem thêm p24 “Econometric Modeling – David Henry and Bent Nielsen”)

Do vậy: trong trường hợp giá trị thống kê nhỏ hơn giá trị tới hạn nên kết luận là: “không thể phủ định giả thiết H0” thay vì “chấp nhận giả thiết H0”

Bên cạnh một số phần mềm quen thuộc dễ sử dụng trong nghiên cứu sử dụng Kinh tế lượng – đặc biệt là nghiên cứu chuỗi thời gian, như EVIEWS, thì các bạn có thể sử dụng GRETL Khác với Eview, GRETL là một phần mêm free và tương đối thân thiện với người dùng. Ngoài ra, GRETL tỏ ra là một phần mềm khá hiệu quả khi nghiên cứu sử dụng cách tiếp cận VAR, ARMA< GARCH, VECM hay Co-integrations. Đây là link của GRETL: http://gretl.sourceforge.net/ Hướng dẫn sử dụng GRETL có trên website này, ở phần Manual

Hendry, David F. and Mizon, Grayham E. (2001) Reformulating empirical macroeconometric modelling. Oxford Review of Economic Policy 16.4 (Winter 2000): p138(2). Abstract: The theory of forecasting is considered in the context of the role of rational expectations, the testing of economic theories and the serious flaws in impulse-response methods of evaluating policies.

Dhrymes, P., Thomakos, D., 1998. “Structural VAR, MARMA, and open economy models.” International Journal of Forecasting 14, 187–198

Abstract: In this paper we examine a number of issues in the context of structural VAR and MARMA open economy macro models. In particular, we examine whether VAR or MARMA is the more appropriate specification; whether expectations are forward or backward looking, and whether a number of restrictions imposed on such models are supported by empirical evidence. Prior restrictions are imposed by means of Lagrange multipliers, which makes many of the tests noted above routine.

John W. Keating (1990) “Identifying VAR models under rational expectations”. Journal of Monetary Economics 25, Pages 453-476

Abstract: This paper shows that the exclusion restrictions used to identify structural vector autoregressions (SVARs) generally yield inconsistent parameter estimates under rational expectations. I develop an alternative method of identifying rational-expectations models within the SVAR framework that circumvents the need of imposing stringent identifying restrictions on the dynamic processes for technologies, preferences, and other mechanisms (e.g., adjustment costs). These strong restrictions may explain why rational-expectations models are frequently rejected by the data. Two empirical examples demonstrate the feasibility and potential advantages of this alternative modeling strategy.