unslothai · danielhanchen · Jun 12, 2026 · gemini-code-assist · Jun 12, 2026 · gemini-code-assist
diff --git a/nb/Kaggle-Whisper.ipynb b/nb/Kaggle-Whisper.ipynb
@@ -675,7 +675,7 @@
     "    train_dataset = train_dataset,\n",
     "    data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor = tokenizer),\n",
     "    eval_dataset = test_dataset,\n",
-    "    tokenizer = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer.feature_extractor,\n",
-    "    processing_class = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer,\\n",
-    "    processing_class = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer,\\n",
     "    compute_metrics = compute_metrics,\n",
     "    args = Seq2SeqTrainingArguments(\n",
     "        # predict_with_generate = True,\n",

diff --git a/nb/Whisper.ipynb b/nb/Whisper.ipynb
@@ -675,7 +675,7 @@
     "    train_dataset = train_dataset,\n",
     "    data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor = tokenizer),\n",
     "    eval_dataset = test_dataset,\n",
-    "    tokenizer = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer.feature_extractor,\n",
-    "    processing_class = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer,\\n",
-    "    processing_class = tokenizer.feature_extractor,\n",
+    "    processing_class = tokenizer,\\n",
     "    compute_metrics = compute_metrics,\n",
     "    args = Seq2SeqTrainingArguments(\n",
     "        # predict_with_generate = True,\n",

@@ -682,7 +682,7 @@
         "    train_dataset = train_dataset,\n",
         "    data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor=tokenizer),\n",
         "    eval_dataset = test_dataset,\n",
-        "    tokenizer = tokenizer.feature_extractor,\n",
+        "    processing_class = tokenizer.feature_extractor,\n",
-        "    processing_class = tokenizer.feature_extractor,\n",
+        "    processing_class = tokenizer,\\n",
-        "    processing_class = tokenizer.feature_extractor,\n",
+        "    processing_class = tokenizer,\\n",
         "    compute_metrics=compute_metrics,\n",
         "    args = Seq2SeqTrainingArguments(\n",
         "        # predict_with_generate=True,\n",

diff --git a/python_scripts/Kaggle-Whisper.py b/python_scripts/Kaggle-Whisper.py
@@ -195,7 +195,7 @@ def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) ->
     train_dataset = train_dataset,
     data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor = tokenizer),
     eval_dataset = test_dataset,
-    tokenizer = tokenizer.feature_extractor,
+    processing_class = tokenizer.feature_extractor,
-    processing_class = tokenizer.feature_extractor,
+    processing_class = tokenizer,
-    processing_class = tokenizer.feature_extractor,
+    processing_class = tokenizer,
     compute_metrics = compute_metrics,
     args = Seq2SeqTrainingArguments(
         # predict_with_generate = True,

diff --git a/python_scripts/Whisper.py b/python_scripts/Whisper.py
@@ -195,7 +195,7 @@ def __call__(self, features: List[Dict[str, Union[List[int], torch.Tensor]]]) ->
     train_dataset = train_dataset,
     data_collator = DataCollatorSpeechSeq2SeqWithPadding(processor = tokenizer),
     eval_dataset = test_dataset,
-    tokenizer = tokenizer.feature_extractor,
+    processing_class = tokenizer.feature_extractor,
-    processing_class = tokenizer.feature_extractor,
+    processing_class = tokenizer,
-    processing_class = tokenizer.feature_extractor,
+    processing_class = tokenizer,
     compute_metrics = compute_metrics,
     args = Seq2SeqTrainingArguments(
         # predict_with_generate = True,