balanced和unbalanced面板数据到底有什么区别?是只要面板数据中有缺失值就算unbalanced数据吗?另外,除了这两种输入方式有些不同外,是不是对于eviews中面板数据相关的分析方法,这两种数据都可以用?
另外,在eviews中,什么时候应该建立balanced panel 文件?什么情况下应该建立dated-regular frequency文件?
我的理解是,当长时间的时间分布与截面成员的分布相同,那么就是平衡态的面板数据;否则就是非平衡态的面板数据。我是根据物理学中的“各态历经原理”来理解的。确实数据仅仅是实际操作的技术问题,与非平衡与平衡概念无关。
“如果每个研究对象都有相同的观测次数,这样的面板就是平衡面板。如果有些对象具有不同的观测次数,我们得到的就是非平衡面板”——古拉扎蒂《计量经济学基础》
最近在做面板数据。。这样理解吧:平衡面板数据说的是 在样本期间,样本数量不变、样本个体不变且数据没有缺失,这样特别的严格!因为有些样本个体虽然不变,但在某些年份某些变量值有缺失,或者个别样本个体在某些年份因为如破产倒闭或无法再跟踪或已不满足条件就不再有数值,类似的,有些样本个体有可能新加进来,这些种种情况都是非平衡面板数据
In a balanced panel, the number of time periods T is the same for all individuals i . Otherwise we are dealing with an unbalanced panel.
In the case of randomly missing data, most Stata commands can be applied to unbalanced panels without causing inconsistency of the estimators.
详细资料见附件“Unbalanced Panel Data Models”
刚才看了高铁梅老师的课件,解决了第一个问题“balanced和unbalanced面板数据到底有什么区别?”
“平衡的意思是,如果按截面成员堆积数据,每个截面成员应包括正好相同的时期;如果按日期堆积数据,每个日期应包含相同数量的截面成员观测值,并按相同顺序排列。特别要指出的是,基础数据并不一定是平衡的,只要在输入文件中有表示即可。如果观测值中有缺失数据,一定要保证文件中给这些缺失值留有位置。 ” ——from 高铁梅
根据这段话,我的理解:有缺失的面板数据不一定就是非平衡数据。平衡数据实际只是一种转换的比较规整的结构,用于更方便的表示成堆积数据。不知理解的对不对?