Задача с интернет-олимпиады (послесловие)

May 06, 2011 00:23

по теории вероятностей для школьников

условие задачи )

Leave a comment

Re: то есть Вы допускаете random_2005 May 6 2011, 10:15:07 UTC
в принципе, да

если нет зависимости роста от пола, то в парах мальчики будут выше с вероятностью 1/2. Соотвественно, количество пар, где мальчики выше, распределено биномиально. Если же доля пар, где мальчики выше, будет существенно отлично от 1/2, это основание отвергнуть гипотезу

график позволяет увидеть, насколько точки симметрично расположены относительно прямой у=х. если, например, мы увидим, что большинство точек лежат выше прямой, это будет признак несостоятельности гипотезы

Единственная проблема может быть в том, что данных может оказаться слишком мало, чтобы отвергнуть гипотезу на требуемом уровне значимости, но здесь уже нужно считать для конкретных значений

Reply

но какой смысл тогда a_shen May 6 2011, 10:16:24 UTC
в случайном паросочетании? почему не отметить все пары?

Reply

Re: но какой смысл тогда random_2005 May 6 2011, 10:26:20 UTC
все пары - это все возможные пары м и д для данного класса?
так делать нельзя, т.к. в этом случае события (м выше д) будут зависимы для разных пар. соотвественно распределение количества пар, где м выше д, уже не будет биномиальным

точнее так делать можно, но тогда придется работать с совершенно неизвестным распределением, а не хорошо изученным биномиальным. соотвественно встанет задача оценки для него доверительных интервалов, что теоретически может оказаться сложной задачей. всегда проще работать с независимыми наблюдениями - для них лучше работают все теоремы, в частности предельные

Reply

не понял - a_shen May 6 2011, 10:50:47 UTC
а какие, собственно говоря, величины независимы в этой ситуации? (когда внутри каждого класса берётся случайное паросочетание) - вроде бы тут ниоткуда биномиальное распределение (ни для общего числа пар, где мальчик выше, ни для числа пар в каждом классе) не получается.

Оно получилось бы, если бы бралось не случайное паросочетание, а случайная выборка из множества пар (возможно, с повторениями) - но тоже только внутри одного класса, а не для общего числа.

Reply

Re: не понял - random_2005 May 6 2011, 10:58:37 UTC
Событие N: в паре N мальчик выше девочки. Если пары набраны случайно (мальчик случайно из множества мальчиков, девочка случайно из множества девочек), то данные события независимы и при нулевой гипотезе имеют вероятность 1/2
Случайная величина N = Индикатору События N, она принимает значения 0 и 1 с вероятностью 1/2
Сумма всех таких случайных величин (их конечно число, условно 10) - это случайная величиная имеющая биномиальное распределение

Reply

сумма, a_shen May 6 2011, 11:19:21 UTC
о которой Вы говорите как имеющей биномиальное распределение - она для каждого класса своя, или речь идёт об общей сумме?

Reply

Re: сумма, random_2005 May 6 2011, 11:27:23 UTC
Сумма считается по конкретной выборке. В нашем случае (вы изначально спрашивали про один класс) вся выборка взята из одного класса. Это конечно ставит вопрос о том, насколько данная выборка репрезентативна для всей генеральной совокупности. Ответ здесь имхо такой, что выборка не репрезентативна для всей совокупности мальчиков и девочек, но она более-менее репрезентативна (т.е. может быть использована на практике) для м и д данного возраста (и региона).

Reply

если a_shen May 6 2011, 18:10:00 UTC
сумма берётся по одной выборке, то число успехов имеет биномиальное распределение (независимые бернуллиевские испытания), причём вероятность успеха в каждом испытании легко вычислить по имеющимся данным (доля пар, где первый рост больше второго). Какой же смысл явно проделывать эти испытания?!

Reply

Re: если random_2005 May 6 2011, 19:46:07 UTC
> вероятность успеха в каждом испытании легко вычислить по имеющимся данным (доля пар, где первый рост больше второго ( ... )

Reply


Leave a comment

Up