Add SAMSum dataset

36d6d073 · Max Kimmich · 458e36ee · 36d6d073 · 36d6d073
Commit 36d6d073 authored 7 months ago by Max Kimmich
--- a/evoprompt/task/__init__.py
+++ b/evoprompt/task/__init__.py
@@ -11,6 +11,7 @@ from evoprompt.task.text_classification import TextClassification
 from evoprompt.task.sentiment_analysis import SentimentAnalysis
 from evoprompt.task.topic_classification import AGNews, TREC
 from evoprompt.task.subjectivity_classification import Subj
+from evoprompt.task.summarization import SAMSum

 from evoprompt.utils import get_all_subclasses


--- a/evoprompt/task/summarization.py
+++ b/evoprompt/task/summarization.py
+from abc import abstractmethod
+from functools import lru_cache
+import logging
+from typing import Mapping
+
+from evaluate import load as load_metric
+from llama_cpp import LlamaGrammar
+from evoprompt.models import LLMModel
+from evoprompt.task import Task
+from evoprompt.task.task import DatasetDatum
+
+
+logger = logging.getLogger(__name__)
+
+
+class Summarization(Task):
+    def __init__(self, *args, **kwargs) -> None:
+        super().__init__(*args, **kwargs)
+
+        self.metric = load_metric("evaluate-metric/rouge")
+
+    def _evaluate_sample(self, prompt: str, datum: DatasetDatum):
+        gold_label = self._get_gold_label_for_datum(datum)
+        response, usage = self.predict(prompt=prompt, datum=datum)
+        response = response.lower()
+        
+        scores = self.metric.compute(predictions=[response], references=[gold_label])
+
+        return scores["rougeL"], usage
+
+    @lru_cache
+    def _get_grammer(self, datum: DatasetDatum, verbose: bool = False):
+        return None
+
+    def _get_prompt_text_for_datum(self, datum: DatasetDatum) -> str:
+        return "\nInput: " + '"' + self._get_text_for_datum(datum) + '"'
+
+    @abstractmethod
+    def _get_text_for_datum(self, datum: DatasetDatum) -> str:
+        pass
+
+    @abstractmethod
+    def _get_gold_label_for_datum(self, datum: DatasetDatum) -> str:
+        pass
+
+    def _aggregate_result(self, results: list[str]) -> float:
+        return sum(results)/len(results)
+
+    @property
+    def metric_name(self):
+        return "rougeL"
+    
+    @property
+    def base_prompt(self):
+        return 'Please summarize the main context.'
+
+
+class SAMSum(Summarization):
+    shorthand = "sams"
+
+    def __init__(self, *args, **kwargs) -> None:
+        super().__init__(
+            *args,
+            validation_dataset="Samsung/samsum",
+            test_dataset="Samsung/samsum",
+            validation_split="train",
+            test_split="test",
+            **kwargs
+        )
+
+    def _get_text_for_datum(self, datum: DatasetDatum) -> str:
+        return datum["dialogue"]
+
+    def _get_gold_label_for_datum(self, datum: DatasetDatum) -> str:
+        return datum["summary"]
\ No newline at end of file