Text Generation
Transformers
PyTorch
Chinese
English
llama
text-generation-inference

Adding Evaluation Results

#15
Files changed (1) hide show
  1. README.md +14 -1
README.md CHANGED
@@ -145,4 +145,17 @@ def lcs(s1, s2):
145
  该函数使用动态规划来计算LCS。它从第一个字符串中的第一个字符开始,并将其添加到存储子序列的`dp`列表中。然后,它循环遍历两个字符串中的字符,如果它们相匹配,则将相应字符添加到`dp`列表中,并将`max_length`存储为当前字符串的最大长度。
146
 
147
  最后,该函数返回`max_length`和两个输入字符串的长度之间的最大值,这表示LCS的长度。请注意,该函数假设输入字符串是字符串,而不是字符数组。如果要将其修改为处理数组,则需要相应地修改该函数。
148
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
145
  该函数使用动态规划来计算LCS。它从第一个字符串中的第一个字符开始,并将其添加到存储子序列的`dp`列表中。然后,它循环遍历两个字符串中的字符,如果它们相匹配,则将相应字符添加到`dp`列表中,并将`max_length`存储为当前字符串的最大长度。
146
 
147
  最后,该函数返回`max_length`和两个输入字符串的长度之间的最大值,这表示LCS的长度。请注意,该函数假设输入字符串是字符串,而不是字符数组。如果要将其修改为处理数组,则需要相应地修改该函数。
148
+ ```
149
+ # [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
150
+ Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_fireballoon__baichuan-vicuna-chinese-7b)
151
+
152
+ | Metric | Value |
153
+ |-----------------------|---------------------------|
154
+ | Avg. | 43.39 |
155
+ | ARC (25-shot) | 43.52 |
156
+ | HellaSwag (10-shot) | 71.12 |
157
+ | MMLU (5-shot) | 46.87 |
158
+ | TruthfulQA (0-shot) | 42.45 |
159
+ | Winogrande (5-shot) | 66.85 |
160
+ | GSM8K (5-shot) | 5.53 |
161
+ | DROP (3-shot) | 27.4 |